ViMax:香港大学开源的多智能体端到端视频生成框架,覆盖创意、剧本到成片全链路
ViMax是由香港大学开源多智能体视频生成框架,旨在解决当前AI视频生成“片段短、一致性差、缺乏叙事深度”的核心痛点。该工具集导演、编剧、制片人、视频生成器功能于一体,...
ViMax是由香港大学开源多智能体视频生成框架,旨在解决当前AI视频生成“片段短、一致性差、缺乏叙事深度”的核心痛点。该工具集导演、编剧、制片人、视频生成器功能于一体,...
HunyuanOCR是腾讯混元开源的端到端OCR专家模型,基于混元原生多模态架构构建,仅1B参数便实现了业界多项SOTA性能。该工具覆盖文字检测识别、复杂文档解析、开放字段信息抽取...
字节跳动旗下智能输入工具豆包输入法近日宣布正式发布,安卓用户已可通过官网及各大应用商店下载体验,iOS版本也将于近期上线。作为基于豆包App同款语音模型打造的输入产品...
YakGPT是一个基于Web技术开发的开源ChatGPT UI工具,其核心定位是“简单、本地运行、高效交互”的智能聊天平台。与官方ChatGPT界面不同,YakGPT无需用户下载安装独立应用,...
DocsGPT 是一款面向开发者与企业的开源 AI 平台,核心聚焦智能代理构建、文档智能分析与企业级搜索场景。它支持 PDF、DOCX 等数十种文件格式解析与多源数据集成,兼容主流 ...
TrendRadar是一款以“轻量、易部署”为核心目标的开源热点监控助手,支持多平台热点资讯爬取、关键词精准筛选,提供企业微信、Telegram、钉钉等多渠道通知推送,可生成HTML...
根据量化对象的不同,量化技术可分为三大核心类型:权重量化(Weight Quantization)、激活量化(Activation Quantization)和混合量化(Mixed-Precision Quantization)。...
LMT(Large-scale Multilingual Translation)是一款开源的大规模多语言翻译项目,核心定位为“以中英为中心”的包容性翻译解决方案,打破传统多语言翻译“英语霸权”的局限...
SmartResume是阿里巴巴团队开源的布局感知智能简历解析系统,专注于解决非结构化简历的结构化提取难题。该系统支持PDF、图片及常见Office文档格式,融合OCR文本提取、YOLO布...
DeepEyesV2 是一款开源的多模态智能体框架,以 Qwen-2.5-VL 系列模型为基础,核心创新在于将视觉理解、代码执行与网络搜索三大能力深度融合进单一推理循环,通过 “冷启动微...
