TLDW:AI驱动的开源YouTube长视频结构化学习工具
TLDW是一款集“AI内容处理、交互学习、个人化管理”于一体的结构化工作区——用户只需粘贴YouTube视频URL,即可自动生成高光片段、结构化摘要、智能问答、关键语录等内容,...
TLDW是一款集“AI内容处理、交互学习、个人化管理”于一体的结构化工作区——用户只需粘贴YouTube视频URL,即可自动生成高光片段、结构化摘要、智能问答、关键语录等内容,...
AudioGPT是由AIGC-Audio团队开源的多模态音频智能处理项目,其核心定位是“音频领域的全栈式解决方案”——通过整合业界成熟的基础模型,实现对语音、音乐、通用声音的“理...
DAIN(Depth-Aware Video Frame Interpolation)是一款专注于解决视频帧插值问题的开源深度学习项目。简单来说,视频帧插值技术的核心是在两个连续的视频帧之间,自动生成全新...
RoomGPT是一款面向普通用户、设计师及技术爱好者的开源AI房间设计工具,同时也是商业产品RoomGPT.io的“初代原型版本”。与后续添加了用户认证、支付订阅、高级功能的付费S...
DocsGPT 是一款面向开发者与企业的开源 AI 平台,核心聚焦智能代理构建、文档智能分析与企业级搜索场景。它支持 PDF、DOCX 等数十种文件格式解析与多源数据集成,兼容主流 ...
Supertonic是一款开源的文本转语音(TTS)系统,由韩国科技公司Supertone Inc.研发并开源,核心目标是解决传统TTS系统“依赖云服务、延迟高、隐私风险、资源占用大”等痛点...
Verl是由字节跳动Seed团队发起、社区共同维护的开源强化学习(RL)训练库,专为大型语言模型(LLMs)设计,该项目以“灵活易用、高效性能、生产级就绪”为核心优势,深度整...
TrendRadar是一款以“轻量、易部署”为核心目标的开源热点监控助手,支持多平台热点资讯爬取、关键词精准筛选,提供企业微信、Telegram、钉钉等多渠道通知推送,可生成HTML...
Memori是一款开源的SQL原生LLM内存引擎,由GibsonAI开发维护,核心定位是为AI模型(LLM)、AI代理及多代理系统提供“可持久化、可查询、用户可控”的智能记忆能力。与传统向...
Call Center AI是微软开源的AI驱动呼叫中心解决方案,基于Azure云服务与OpenAI GPT模型构建,支持通过API发起AI代理呼叫或用户直接拨打指定号码对接机器人。该工具具备多语...
LMT(Large-scale Multilingual Translation)是一款开源的大规模多语言翻译项目,核心定位为“以中英为中心”的包容性翻译解决方案,打破传统多语言翻译“英语霸权”的局限...
SmartResume是阿里巴巴团队开源的布局感知智能简历解析系统,专注于解决非结构化简历的结构化提取难题。该系统支持PDF、图片及常见Office文档格式,融合OCR文本提取、YOLO布...
Astron Agent是科大讯飞开源的企业级、商业友好型智能工作流开发平台,集成AI工作流编排、模型管理、智能RPA自动化、工具生态集成与团队协作能力。可帮助企业快速构建可扩展...
LazyCraft是一款基于LazyLLM构建的开源AI Agent应用开发与管理平台,核心定位是“降低AI应用开发门槛、降低落地成本、提升迭代效率”。无论是缺乏专业开发经验的非技术人员...
Kosong是由Moonshot AI开发的开源LLM抽象层,名称源自马来语和印尼语中的“空”,寓意为AI代理开发提供灵活、无束缚的底层支撑。该项目基于Python 3.13+构建,核心目标是统...