Step3-VL-10B:阶跃星辰开源的10B参数轻量多模态基础模型
STEP3-VL-10B是阶跃星辰(StepFun AI)开源的轻量级多模态基础大模型,核心定位是在10B(100亿)参数的紧凑规模下,实现高效性与前沿多模态智能的极致平衡,打破“参数越大...
STEP3-VL-10B是阶跃星辰(StepFun AI)开源的轻量级多模态基础大模型,核心定位是在10B(100亿)参数的紧凑规模下,实现高效性与前沿多模态智能的极致平衡,打破“参数越大...
MiniCPM 是由面壁智能、清华大学自然语言处理实验室、中国人民大学高瓴人工智能学院联合开发的一系列轻量级大语言模型开源项目。项目涵盖多版本模型迭代,兼顾性能与效率,...
司农大语言模型(Sinong)是由南京农业大学联合南京理工大学研发的国内首个通用农业领域开源垂直大语言模型,依托超40亿token的农业领域高质量数据集训练构建,提供8B和32B...
AntAngelMed 是由浙江健康信息中心、蚂蚁医疗等联合研发的开源医疗大语言模型,是当前规模最大、性能最强的开源医疗语言模型之一。依托 Ling-flash-2.0 高效 MoE 架构,模型...
GLM-ASR 是由智谱 AI 团队开源的一款轻量级高性能语音识别项目,核心模型为 GLM-ASR-Nano-2512,参数规模仅 1.5B,却在多项语音识别基准测试中表现优于 OpenAI Whisper V3。...
LongCat-Image是美团LongCat团队开源的一款轻量级双语(中英文)图像生成与编辑基础模型,仅6B参数却具备行业领先的性能表现。该模型不仅能实现高质量文本到图像生成,还支...
NewBie-image-Exp0.1是由NewBieAI-Lab团队开源的一款面向动漫风格的文本到图像生成基础模型,该模型以Next-DiT架构为核心基础,整体参数规模达到3.5B,专门针对二次元动漫图...
HunyuanImage-3.0是腾讯混元团队推出的原生多模态图像生成模型,核心定位是“统一多模态理解与生成的自回归框架工具”。与传统基于DiT的图像生成模型不同,它突破性地采用“...
Step-Audio-R1是阶跃星辰(Stepfun)开源的首款成功解锁测试时计算缩放能力的音频语言模型,核心解决了传统音频模型“反向缩放”的行业痛点,即推理链延长导致性能下降的问题...