AI新闻资讯 - 最新人工智能技术动态与热点资讯

Chart-GPT：开源文本转图表AI工具，秒级生成美观可视化图表

Chart-GPT是一款开源的AI驱动型数据可视化工具，其核心定位是“将文本描述快速转化为高质量图表”，让用户无需掌握复杂的图表制作技能（如Excel、Tableau操作），也无需手动...

3个月前人工智能研究所

120

AudioGPT：开源多模态音频处理工具，一站式实现语音、音乐、声音生成与理解

AudioGPT是由AIGC-Audio团队开源的多模态音频智能处理项目，其核心定位是“音频领域的全栈式解决方案”——通过整合业界成熟的基础模型，实现对语音、音乐、通用声音的“理...

3个月前 AI铺子

86

RoomGPT：开源AI房间设计工具，上传照片一键生成梦想空间变体

RoomGPT是一款面向普通用户、设计师及技术爱好者的开源AI房间设计工具，同时也是商业产品RoomGPT.io的“初代原型版本”。与后续添加了用户认证、支付订阅、高级功能的付费S...

3个月前 AI工具集

122

DocsGPT：开源企业级 AI 文档助手与智能代理构建工具

DocsGPT 是一款面向开发者与企业的开源 AI 平台，核心聚焦智能代理构建、文档智能分析与企业级搜索场景。它支持 PDF、DOCX 等数十种文件格式解析与多源数据集成，兼容主流 ...

3个月前 AI工具箱

29

PaintsChainer：基于Chainer的开源线稿半自动上色工具，CNN驱动高效色彩填充

PaintsChainer是一款开源的线稿自动上色工具，其核心定位是“基于深度学习的线稿半自动色彩填充解决方案”。该项目由Preferred Networks（日本知名AI企业，简称PFN）主导开...

3个月前人工智能研究所

83

Supertonic：开源的超高速设备端文本转语音工具

Supertonic是一款开源的文本转语音（TTS）系统，由韩国科技公司Supertone Inc.研发并开源，核心目标是解决传统TTS系统“依赖云服务、延迟高、隐私风险、资源占用大”等痛点...

3个月前 AI铺子

147

MiMo-Embodied：小米开源的7B跨具身视觉语言模型，打通自动驾驶与具身AI双领域推理

MiMo-Embodied是小米公司具身智能团队推出的一款开源跨具身视觉语言模型（Vision-Language Model, VLM），于2025年正式发布。作为全球首个整合自动驾驶与具身AI两大关键领域...

3个月前人工智能研究所

93

seekdb：OceanBase推出的AI原生多模态混合搜索数据库

seekdb是由OceanBase团队开发的开源AI原生搜索数据库，它打破了传统数据库对数据类型的割裂限制，在单一引擎中实现了关系型数据、向量数据、文本数据、JSON数据及GIS地理空...

3个月前 AI铺子

49

Verl：字节跳动开源的 LLM 强化学习训练工具，高效支持 RLHF 与多算法部署

Verl是由字节跳动Seed团队发起、社区共同维护的开源强化学习（RL）训练库，专为大型语言模型（LLMs）设计，该项目以“灵活易用、高效性能、生产级就绪”为核心优势，深度整...

3个月前 AI工具集

328

TrendRadar：轻量易部署的多平台热点监控助手，聚焦精准资讯与多端推送

TrendRadar是一款以“轻量、易部署”为核心目标的开源热点监控助手，支持多平台热点资讯爬取、关键词精准筛选，提供企业微信、Telegram、钉钉等多渠道通知推送，可生成HTML...

3个月前 AI工具箱

502

AI新闻

热门人工智能技术动态与AI行业资讯

Chart-GPT：开源文本转图表AI工具，秒级生成美观可视化图表

AudioGPT：开源多模态音频处理工具，一站式实现语音、音乐、声音生成与理解

RoomGPT：开源AI房间设计工具，上传照片一键生成梦想空间变体

DocsGPT：开源企业级 AI 文档助手与智能代理构建工具

PaintsChainer：基于Chainer的开源线稿半自动上色工具，CNN驱动高效色彩填充

Supertonic：开源的超高速设备端文本转语音工具

MiMo-Embodied：小米开源的7B跨具身视觉语言模型，打通自动驾驶与具身AI双领域推理

seekdb：OceanBase推出的AI原生多模态混合搜索数据库

Verl：字节跳动开源的 LLM 强化学习训练工具，高效支持 RLHF 与多算法部署

TrendRadar：轻量易部署的多平台热点监控助手，聚焦精准资讯与多端推送