AI新闻资讯 - 最新人工智能技术动态与热点资讯

LongCat-Audio-Codec：美团开源音频编解码方案，为 Speech LLM 提供超低比特率高保真令牌生成与解码

LongCat-Audio-Codec 是美团 LongCat 团队开源的音频编码（Tokenizer）与解码（Detokenizer）解决方案，专为语音大语言模型（Speech LLM）设计。该方案通过并行生成语义令牌...

6个月前 AI工具箱

84

Coral NPU：Google 开源的 RISC-V 架构 ML 推理硬件加速器，赋能超低功耗可穿戴设备 SoC

Coral NPU是由Google Research设计的开源神经网络处理单元（NPU），基于RISC-V 32位指令集架构，定位为超低功耗片上系统（SoC）的ML推理硬件加速器，核心适配助听器、AR眼镜...

6个月前 97ai

628

nanoGPT：Karpathy 开源的极简型 GPT 开发工具，支持多硬件适配与 GPT-2 复现

nanoGPT是由AI研究者Andrej Karpathy开发的开源项目，基于PyTorch框架构建，定位为“最简单、最高效的中等规模GPT训练与微调仓库”。它是minGPT的重写版本，核心目标是“优...

6个月前 AI工具箱

130

MiniMind：个人可部署的超轻量开源大语言模型训练与部署工具

MiniMind 是一个旨在拉低大语言模型（LLM）学习与实践门槛的开源项目，核心目标是让普通用户通过 “3 元 GPU 服务器成本 + 2 小时单卡训练”，从 0 构建并部署仅 25.8M 参数...

6个月前 AI工具集

152

nanochat：轻量类 ChatGPT 全栈开源项目，支持低成本端到端实现

nanochat 是由 AI 领域知名开发者 Andrej Karpathy 团队开发的开源项目，旨在提供一个轻量、简洁、可定制的类 ChatGPT 全栈解决方案。该项目覆盖从分词、预训练、微调（SFT...

6个月前 dotaai

77

Local-NotebookLM：开源本地部署的PDF转音频工具，支持多 LLM 与 TTS 模型集成

Local-NotebookLM 是一款开源的本地 AI 工具，核心功能是将 PDF 文档转换为播客、摘要、访谈等多种风格的音频内容。该工具无需依赖云端服务，可通过本地部署的 LLM（如 Oll...

6个月前 AI工具集

192

Daytona：开源 AI 生成代码安全运行基础设施，极速隔离沙箱与全流程编程控制

Daytona 是一款专注于 AI 生成代码安全运行的开源基础设施，通过极速隔离沙箱（90 毫秒内启动）为 AI 生成代码提供零风险运行环境，支持多语言 SDK、Git 集成及 Docker 镜像...

6个月前 AI工具集

104

OpenAssistant：开源AI对话聊天系统，支持协作式数据训练与多场景交互

OpenAssistant 是一款开源的AI对话聊天系统，旨在通过协作模式推动高质量聊天大型语言模型（LLM）的普及。项目提供开放的聊天交互界面、协作式数据收集平台、完整的模型训练...

6个月前 AI工具箱

89

UniPixel：香港理工大学联合腾讯开源的像素级视觉语言统一理解模型

UniPixel是由香港理工大学、腾讯ARC实验室等机构联合开发的开源多模态大模型（MLLM），专注于像素级视觉语言理解与细粒度推理任务。该模型基于Qwen2.5-VL系列扩展，融合视觉...

6个月前人工智能研究所

47

DiaMoE-TTS：巨人网络联合清华大学开源的跨方言语音合成框架，支持 11 种方言与多语言兼容

DiaMoE-TTS 是由巨人网络联合清华大学开发的开源多方言文本到语音（TTS）框架，该框架基于 F5-TTS 架构扩展，通过统一国际音标（IPA）前端实现跨方言语音表示标准化，结合混...

6个月前 AI铺子

85

AI新闻

热门人工智能技术动态与AI行业资讯

LongCat-Audio-Codec：美团开源音频编解码方案，为 Speech LLM 提供超低比特率高保真令牌生成与解码

Coral NPU：Google 开源的 RISC-V 架构 ML 推理硬件加速器，赋能超低功耗可穿戴设备 SoC

nanoGPT：Karpathy 开源的极简型 GPT 开发工具，支持多硬件适配与 GPT-2 复现

MiniMind：个人可部署的超轻量开源大语言模型训练与部署工具

nanochat：轻量类 ChatGPT 全栈开源项目，支持低成本端到端实现

Local-NotebookLM：开源本地部署的PDF转音频工具，支持多 LLM 与 TTS 模型集成

Daytona：开源 AI 生成代码安全运行基础设施，极速隔离沙箱与全流程编程控制

OpenAssistant：开源AI对话聊天系统，支持协作式数据训练与多场景交互

UniPixel：香港理工大学联合腾讯开源的像素级视觉语言统一理解模型

DiaMoE-TTS：巨人网络联合清华大学开源的跨方言语音合成框架，支持 11 种方言与多语言兼容