AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
人工智能研究所

人工智能研究所

发现AI神器,探索AI技术!

108投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    MOSS-Speech:复旦大学开源的端到端语音大模型,无文本引导实现自然语音交互

    MOSS-Speech:复旦大学开源的端到端语音大模型,无文本引导实现自然语音交互

    MOSS-Speech是由复旦大学邱锡鹏教授领衔的OpenMOSS团队(国内知名AI开源团队,曾推出MOSS大模型系列)研发的原生语音到语音(Speech-to-Speech, S2S)开源大模型,旨在打破...

    1周前 人工智能研究所
    83
    ROCK:阿里巴巴开源的强化学习沙箱环境构建与管理工具

    ROCK:阿里巴巴开源的强化学习沙箱环境构建与管理工具

    ROCK(Reinforcement Open Construction Kit)是由阿里巴巴淘天未来生活实验室与AI引擎团队联合开发的开源强化学习环境管理框架,基于客户端-服务器架构,提供沙箱环境的构...

    1周前 人工智能研究所
    38
    DeepSeek推出全球首个开源IMO金牌数学模型,AI推理能力迈向新高度

    DeepSeek推出全球首个开源IMO金牌数学模型,AI推理能力迈向新高度

    2025年11月27日晚,人工智能领域迎来里程碑式突破——中国AI公司DeepSeek在Hugging Face平台正式开源全球首个达到国际数学奥林匹克竞赛(IMO)金牌水平的数学推理模型DeepS...

    1周前 人工智能研究所
    46
    Local Dream:在 Android 端运行 Stable Diffusion 的图像生成工具

    Local Dream:在 Android 端运行 Stable Diffusion 的图像生成工具

    Local Dream是一个专注于Android平台的开源AI图像生成项目,核心目标是让用户在移动设备上无需依赖云端算力,即可本地运行Stable Diffusion模型完成各类图像创作。区别于需...

    1周前 人工智能研究所
    110
    Ruyi:CreateAI推出的开源图像转视频大模型,支持768分辨率与多维度视频控制

    Ruyi:CreateAI推出的开源图像转视频大模型,支持768分辨率与多维度视频控制

    Ruyi是Ruyi-Models项目的核心图像到视频(Image-to-Video, i2v)生成模型,由CreateAI团队开发并开源,旨在为用户提供“低门槛、高性能、高自由度”的视频生成解决方案。不...

    2周前 人工智能研究所
    26
    批量归一化(Batch Normalization)为什么能加速模型训练?

    批量归一化(Batch Normalization)为什么能加速模型训练?

    批量归一化(Batch Normalization, BN)作为一种关键技术,通过规范化中间层输入分布,显著提升了训练速度与模型稳定性。本文AI铺子将从技术原理、数学推导、工程实现及实际...

    2周前 人工智能研究所
    67
    Chart-GPT:开源文本转图表AI工具,秒级生成美观可视化图表

    Chart-GPT:开源文本转图表AI工具,秒级生成美观可视化图表

    Chart-GPT是一款开源的AI驱动型数据可视化工具,其核心定位是“将文本描述快速转化为高质量图表”,让用户无需掌握复杂的图表制作技能(如Excel、Tableau操作),也无需手动...

    2周前 人工智能研究所
    46
    PaintsChainer:基于Chainer的开源线稿半自动上色工具,CNN驱动高效色彩填充

    PaintsChainer:基于Chainer的开源线稿半自动上色工具,CNN驱动高效色彩填充

    PaintsChainer是一款开源的线稿自动上色工具,其核心定位是“基于深度学习的线稿半自动色彩填充解决方案”。该项目由Preferred Networks(日本知名AI企业,简称PFN)主导开...

    2周前 人工智能研究所
    22
    MiMo-Embodied:小米开源的7B跨具身视觉语言模型,打通自动驾驶与具身AI双领域推理

    MiMo-Embodied:小米开源的7B跨具身视觉语言模型,打通自动驾驶与具身AI双领域推理

    MiMo-Embodied是小米公司具身智能团队推出的一款开源跨具身视觉语言模型(Vision-Language Model, VLM),于2025年正式发布。作为全球首个整合自动驾驶与具身AI两大关键领域...

    2周前 人工智能研究所
    56
    VibeThinker-1.5B:微博开源的1.5B小参数量高性价比强推理模型

    VibeThinker-1.5B:微博开源的1.5B小参数量高性价比强推理模型

    VibeThinker-1.5B是一款仅1.5B参数的开源小参数量密集型模型,核心突破在于通过“频谱到信号原理”和两阶段多样性探索蒸馏+强化学习优化,打破了“小模型缺乏强推理能力”的...

    3周前 人工智能研究所
    32
  • 上一页
  • 1
  • 2
  • 3
  • 4
  • 5
  • 下一页

最新文章

VibeVoice:微软开源的 AI 语音合成工具,实现低延迟长音频与多语种语音生成

2025-12-11 AI新闻

CosyVoice:阿里通义开源的多语言低延迟 TTS 框架,支持跨语言克隆与流式语音合成

2025-12-11 AI新闻

从零开始学AI:欠拟合和过拟合的区别全讲解

2025-12-11 AI教程

LuoGen-agent:开源 AI 视频生成智能体,一键实现爆款数字人口播视频自动化生产

2025-12-11 AI新闻

Mistral AI 推出 Devstral 2 系列编码模型 成本效率较 Claude Sonnet 提升 7 倍

2025-12-10 AI新闻

开源大模型新标杆:DeepSeek-V3.2 凭何实现高效与智能双突破

2025-12-10 AI新闻

热门工具

飞象老师:猿辅导专为教师研发的AI教学动画与课件生成工具

飞象老师

飞象老师是猿辅导集团推出的国内首个面向中小学教师群体、专注于教学内容创作的AI专业工具平台。该平台以“赋能教师、减负增效”为核心理念,...
Hum to Search:AI哼唱识曲神器,无需下载即开即用的在线音乐识别平台

Hum to Search

Hum to Search 是一款基于AI技术的在线音乐识别工具,专为解决“旋律在脑中却不知歌名”的困扰而设计。用户只需通过浏览器打开Hum to Search官...
WPS灵犀:金山办公(WPS Office)推出的AI智能辅助写作与PPT生成工具

WPS灵犀

WPS灵犀是金山办公(WPS Office)旗下推出的AI智能辅助写作与PPT生成工具,依托人工智能大模型技术,专注于帮助用户高效生成PPT、文档、报告等...
ZenMux:高性价比AI API 网关平台,支持多个大模型调用与智能容灾

ZenMux

ZenMux 是一个面向开发者与企业的生成式人工智能(GenAI)API 网关平台,它聚合了全球顶级大模型(如 Qwen3-Max、MetaGPT 等)的“超级接入层...
iMini AI:全栈式AI智能助手平台,集成幻灯片生成、深度研究、文档处理、视频与图像创作

iMini AI

iMini AI 是一个基于人工智能技术打造的多模态超级智能助手订阅平台,致力于为用户提供从内容创作到智能研究的一站式AI解决方案。该平台整合了...
文优小助:AI驱动的学术写作智能助手,一键生成文献综述、开题报告与论文初稿

文优小助

文优小助是一款专注于学术场景的人工智能写作助手,定位于高校学生、科研人员及教育工作者,旨在降低学术写作门槛,提高内容产出效率。它不是...
© 2025 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜