nanochat:轻量类 ChatGPT 全栈开源项目,支持低成本端到端实现
nanochat 是由 AI 领域知名开发者 Andrej Karpathy 团队开发的开源项目,旨在提供一个轻量、简洁、可定制的类 ChatGPT 全栈解决方案。该项目覆盖从分词、预训练、微调(SFT...
nanochat 是由 AI 领域知名开发者 Andrej Karpathy 团队开发的开源项目,旨在提供一个轻量、简洁、可定制的类 ChatGPT 全栈解决方案。该项目覆盖从分词、预训练、微调(SFT...
Local-NotebookLM 是一款开源的本地 AI 工具,核心功能是将 PDF 文档转换为播客、摘要、访谈等多种风格的音频内容。该工具无需依赖云端服务,可通过本地部署的 LLM(如 Oll...
Daytona 是一款专注于 AI 生成代码安全运行的开源基础设施,通过极速隔离沙箱(90 毫秒内启动)为 AI 生成代码提供零风险运行环境,支持多语言 SDK、Git 集成及 Docker 镜像...
OpenAssistant 是一款开源的AI对话聊天系统,旨在通过协作模式推动高质量聊天大型语言模型(LLM)的普及。项目提供开放的聊天交互界面、协作式数据收集平台、完整的模型训练...
UniPixel是由香港理工大学、腾讯ARC实验室等机构联合开发的开源多模态大模型(MLLM),专注于像素级视觉语言理解与细粒度推理任务。该模型基于Qwen2.5-VL系列扩展,融合视觉...
DiaMoE-TTS 是由巨人网络联合清华大学开发的开源多方言文本到语音(TTS)框架,该框架基于 F5-TTS 架构扩展,通过统一国际音标(IPA)前端实现跨方言语音表示标准化,结合混...
MineContext 是火山引擎开源的主动式上下文感知 AI 助手,以 “挖掘并整合上下文” 为核心,将分散的多模态数据(文档、截图、音视频等)视为可组合的 “信息方块”,通过轻...
MinerU 是由 OpenDataLab 开发的开源多模态大模型工具,专注于解决 PDF 等复杂文档的内容提取难题。它通过创新的两阶段推理架构和原生高分辨率处理能力,在布局分析、表格识...
Kandinsky 5.0是由ai-forever团队开源的扩散模型家族,核心聚焦视频生成(图像生成待上线),已开源的Kandinsky 5.0 T2V Lite(2B参数)在同类开源模型中排名第一,不仅优于...
SAIL-VL2 是字节跳动开源的视觉语言模型,以 2B/8B 参数规模实现了行业顶尖性能,在 106 个数据集上验证了其在视觉问答、文档理解、图表解读等多任务中的有效性。该模型通过...