LiveCC:开源实时视频解说大模型,融合流式语音转录与多模态理解
LiveCC 是一款开源实时视频解说大语言模型(Video LLM),旨在通过融合视频视觉信息与流式语音转录(ASR)文本,实现对视频内容的实时理解与动态解说。该项目提供从数据生产...
LiveCC 是一款开源实时视频解说大语言模型(Video LLM),旨在通过融合视频视觉信息与流式语音转录(ASR)文本,实现对视频内容的实时理解与动态解说。该项目提供从数据生产...
Katakate(简称 k7)是一个开源的轻量级安全 VM 沙箱工具,基于 Kubernetes、Kata Containers 和 Firecracker 等成熟技术构建,旨在为大规模 AI 计算、无服务器架构、CI/CD...
Open Notebook 是一款开源、隐私优先的研究工具,作为 Google Notebook LM 的替代方案,支持本地化部署与数据自主控制。它兼容 16+ AI 模型,可管理 PDF、音视频等多模态内...
2025年10月21日,OpenAI正式发布ChatGPT Atlas——一款以ChatGPT为核心构建的全新网页浏览器。这款产品突破传统浏览器的功能边界,旨在将AI“超级助手”体验融入网页使用全...
ChopperBot 是一款开源全自动化多平台直播切片机器人,专注于直播视频的全流程处理,涵盖热门直播爬取、智能切片、标题封面生成及跨平台发布等功能。其采用插件化架构,支持...
VitaBench 是一款由美团与 Sierra Research 联合开发的开源基准测试框架,专为评估大型语言模型(LLM)智能体在真实生活服务场景中的综合能力而设计。该框架通过模拟外卖、...
Genkit是Google Firebase团队开发并开源的全栈AI应用开发框架,核心目标是简化AI应用从开发、测试到生产部署的全流程。该框架提供统一接口,可无缝集成Google Gemini、Open...
OpenSpec 是 Fission-AI 开源的 AI 编程辅助工具,核心靠 “结构化规范文档” 解决 AI 编程中 “需求藏在聊天记录里导致模糊、返工” 的痛点。它无需 API 密钥,通过轻量级...
MemU 是由 NevaMind-AI 开发的开源 AI 伴侣记忆框架,旨在为 AI 伴侣提供高精度、低成本、可扩展的记忆能力。通过文件系统式记忆组织、互联知识图谱、自适应遗忘机制等核心...
Kronos是首个针对金融市场K线序列的开源基础模型,训练数据覆盖全球45+交易所。该模型采用“K线令牌化+自回归Transformer”两阶段框架,将连续的OHLCV(开盘价、最高价、最...