LLaDA2.0:蚂蚁集团开源的大参数扩散型生成式 AI 模型
LLaDA2.0 是蚂蚁集团推出的一系列离散扩散大型语言模型(dLLMs),涵盖 16B 参数的基础版本与 100B 参数的混合专家(MoE)版本,是目前参数规模最大的扩散语言模型之一。该...
LLaDA2.0 是蚂蚁集团推出的一系列离散扩散大型语言模型(dLLMs),涵盖 16B 参数的基础版本与 100B 参数的混合专家(MoE)版本,是目前参数规模最大的扩散语言模型之一。该...
SCAIL是智谱AI开源的一款面向生产级应用的角色动画生成框架,核心基于3D一致姿态表示的上下文学习技术,解决了传统角色动画生成中泛化能力弱、复杂场景运动不连贯的痛点。该...
欠拟合(Underfitting)和过拟合(Overfitting)这两种问题会严重影响模型的性能和泛化能力,理解它们的区别以及如何应对是掌握机器学习的关键一步。本文AI铺子将深入探讨欠...
AI Toolkit是由Ostris团队开源的全能型扩散模型训练套件,其核心定位是为消费级硬件用户提供低成本、高易用性的图像与视频扩散模型训练解决方案。不同于专业级AI训练工具对...
STARFlow-V 是苹果团队研发的首款基于归一化流的因果视频生成模型,打破了视频生成领域扩散模型的技术垄断。该模型采用全局 - 局部架构实现时空特征解耦,结合流分数匹配去...
BAGEL是字节跳动Seed团队开源的一款All-in-One多模态统一基础模型,具备7B活跃参数(总参数14B),采用创新的混合Transformer专家(MoT)架构,基于大规模交错式文本、图像...
PartCrafter是由北京大学、字节跳动与卡内基梅隆大学联合开源的结构化 3D 网格生成模型,该模型创新性地采用组合式潜在空间与局部 - 全局联合去噪 Transformer 架构,可直接...
BERT模型凭借其强大的语言理解和生成能力,成为众多任务的核心工具。针对中文文本的特殊性,中文BERT模型在分词粒度选择和分词器适配方面存在独特挑战。本文AI铺子将系统梳...
近日,OpenAI 旗下广受欢迎的人工智能聊天机器人 ChatGPT 遭遇服务故障问题,在 12 月 2 日和 3 日接连出现服务中断情况,致使部分用户无法正常使用该服务,引发广泛关注。...
GELab-Zero是由阶跃星辰开源的GUI智能体解决方案,整合了工程化基础设施与4B轻量模型,主打本地部署、一键启动和多设备任务自动化能力。该项目针对移动生态碎片化带来的工程...
