AI工具箱的个人主页

DeepSeek-Math-V2：DeepSeek开源的可自我验证数学推理大语言模型

DeepSeek-Math-V2 是由深度求索（deepseek-ai）团队基于 DeepSeek-V3.2-Exp-Base 模型打造的开源数学推理大模型，核心聚焦于可自我验证的数学推理能力构建。该模型创新性地...

6个月前 AI工具箱

253

如何避免BERT过拟合？这4种正则化策略必须掌握

当训练数据规模不足或任务复杂度过高时，BERT模型极易陷入过拟合困境，本文AI铺子将系统梳理BERT过拟合的成因，并重点解析Dropout、L1/L2正则化、早停（Early Stopping）、...

6个月前 AI工具箱

158

GigaWorld-0：极佳视界（GigaAI）开源的具身智能专用世界模型框架

GigaWorld-0是由极佳视界（GigaAI）开源的具身智能专用世界模型框架，其核心定位为“世界模型即数据引擎”，通过GigaWorld-0-Video和GigaWorld-0-3D两大协同组件，首次实现...

6个月前 AI工具箱

381

Mistral 3：Mistral AI 开源的多模态模型家族，支持从 3B 到 675B 参数全场景部署

Mistral 3 是由 Mistral AI 开发的全规模开源多模态 AI 模型家族，该家族涵盖从 3B 参数的边缘轻量模型（Ministral 3 系列）到 675B 参数的云端旗舰模型（Mistral Large 3）...

6个月前 AI工具箱

396

HunyuanImage-3.0：腾讯混元开源的原生多模态图像生成模型，兼顾超高性能与智能推理

HunyuanImage-3.0是腾讯混元团队推出的原生多模态图像生成模型，核心定位是“统一多模态理解与生成的自回归框架工具”。与传统基于DiT的图像生成模型不同，它突破性地采用“...

6个月前 AI工具箱

275

可灵AI O1全量上线：统一多模态架构开启视频创作“一句话时代”

可灵AI公司今日正式宣布，其自主研发的全球首个统一多模态视频大模型O1于零时起面向公众全量开放。该模型凭借MVL（多模态视觉语言）统一交互架构与Chain-of-Thought推理链路...

6个月前 AI工具箱

161

深入理解语义分割：架构原理、常用模型与评估指标全解析

语义分割作为计算机视觉领域的核心技术之一，旨在将图像中的每个像素赋予语义类别标签，实现从像素级到语义级的理解。本文AI铺子将从架构原理、经典模型、评估指标三个维度...

6个月前 AI工具箱

530

ChronoEdit：英伟达开源的时间一致型AI图像编辑与视频生成工具

ChronoEdit是英伟达NVIDIA多伦多AI实验室（nv-tlabs）开发的开源图像编辑与世界模拟工具，核心创新在于将传统图像编辑重构为视频生成任务——以输入图像和目标编辑图像作为...

6个月前 AI工具箱

110

网易云音乐“AI写歌”功能开启测试：一键将灵感转化为完整歌曲

近日，网易云音乐旗下创新项目“网易天音”正式推出“AI写歌”趣味功能并开启上线测试。“AI写歌”功能具备免费使用、操作便捷两大核心优势。用户只需在网易云音乐移动端首...

6个月前 AI工具箱

149

WithAnyone：复旦 & 阶跃星辰联合开源的 AI 合照生成模型，一键实现自然多身份同框

WithAnyone是由复旦大学与阶跃星辰联合开源的多身份AI合照生成项目，基于FLUX扩散模型架构构建，核心解决传统人像生成中的“复制粘贴”伪影问题。该项目通过大规模配对数据...

6个月前 AI工具箱

172

AI工具箱

文章

工具

软件

图书

DeepSeek-Math-V2：DeepSeek开源的可自我验证数学推理大语言模型

如何避免BERT过拟合？这4种正则化策略必须掌握

GigaWorld-0：极佳视界（GigaAI）开源的具身智能专用世界模型框架

Mistral 3：Mistral AI 开源的多模态模型家族，支持从 3B 到 675B 参数全场景部署

HunyuanImage-3.0：腾讯混元开源的原生多模态图像生成模型，兼顾超高性能与智能推理

可灵AI O1全量上线：统一多模态架构开启视频创作“一句话时代”

深入理解语义分割：架构原理、常用模型与评估指标全解析

ChronoEdit：英伟达开源的时间一致型AI图像编辑与视频生成工具

网易云音乐“AI写歌”功能开启测试：一键将灵感转化为完整歌曲

WithAnyone：复旦 & 阶跃星辰联合开源的 AI 合照生成模型，一键实现自然多身份同框