批量归一化(Batch Normalization)为什么能加速模型训练?
批量归一化(Batch Normalization, BN)作为一种关键技术,通过规范化中间层输入分布,显著提升了训练速度与模型稳定性。本文AI铺子将从技术原理、数学推导、工程实现及实际...
批量归一化(Batch Normalization, BN)作为一种关键技术,通过规范化中间层输入分布,显著提升了训练速度与模型稳定性。本文AI铺子将从技术原理、数学推导、工程实现及实际...
Chart-GPT是一款开源的AI驱动型数据可视化工具,其核心定位是“将文本描述快速转化为高质量图表”,让用户无需掌握复杂的图表制作技能(如Excel、Tableau操作),也无需手动...
PaintsChainer是一款开源的线稿自动上色工具,其核心定位是“基于深度学习的线稿半自动色彩填充解决方案”。该项目由Preferred Networks(日本知名AI企业,简称PFN)主导开...
MiMo-Embodied是小米公司具身智能团队推出的一款开源跨具身视觉语言模型(Vision-Language Model, VLM),于2025年正式发布。作为全球首个整合自动驾驶与具身AI两大关键领域...
VibeThinker-1.5B是一款仅1.5B参数的开源小参数量密集型模型,核心突破在于通过“频谱到信号原理”和两阶段多样性探索蒸馏+强化学习优化,打破了“小模型缺乏强推理能力”的...
在深度学习模型部署场景中,量化技术已成为平衡模型性能与硬件资源的关键手段。然而,量化级别的选择并非越激进越好,过度量化会导致模型精度损失超过5%,而保守量化则可能...
InfinityStar 是字节跳动开源的视觉生成框架,核心基于统一时空自回归建模,实现了图像与视频生成的一体化解决方案。该框架突破传统自回归模型的局限,首次支持工业级 720p...
KaLM-Embedding是一款开源的多功能紧凑多语言文本嵌入模型,聚焦通用文本嵌入任务,凭借多语言支持、紧凑高效、优质训练数据及先进训练技术四大核心优势,在语义表征任务中...
Kosong是由Moonshot AI开发的开源LLM抽象层,名称源自马来语和印尼语中的“空”,寓意为AI代理开发提供灵活、无束缚的底层支撑。该项目基于Python 3.13+构建,核心目标是统...
PandaWiki是由长亭科技(Chaitin)开发的开源AI知识库搭建系统,以AI大模型为核心驱动力,支持快速搭建产品文档、技术手册、FAQ等多样化知识库。其集成了AI创作、智能问答、...
