VRAG:阿里通义开源的多模态RAG框架,支持图文视频统一检索与强化学习推理
VRAG是阿里巴巴通义实验室开源的新一代多模态检索增强生成(RAG)框架,核心包含VRAG纯视觉RAG与VimRAG全模态RAG两大模块,支持文本、图片、视频统一检索,通过强化学习与动...
VRAG是阿里巴巴通义实验室开源的新一代多模态检索增强生成(RAG)框架,核心包含VRAG纯视觉RAG与VimRAG全模态RAG两大模块,支持文本、图片、视频统一检索,通过强化学习与动...
Claude-Code-Best-Practice是由社区认证架构师维护的系统化Claude Code使用指南与最佳实践库,提供完整的命令、智能体、技能、MCP服务等核心功能教程,包含可直接复用的工作...
Claude Mythos Preview是Anthropic公司发布的最高层级通用前沿大语言模型,内部代号Capybara,命名取自希腊语“叙述/话语”,象征对复杂世界的系统性理解与表达。它独立于现...
CutClaw是北京交通大学与大湾区大学GVCLab联合研发的开源端到端AI视频剪辑工具,专注长视频素材与音乐的智能同步剪辑。通过多智能体流水线技术,实现一键解析素材、自然语言...
OpenHarness是港大开源的轻量级AI智能体驾驭框架,以1.1万行Python代码实现Claude Code核心能力,内置43+工具、多级权限管控、持久化记忆与多智能体协同功能,支持任意大模...
InternSVG是由上海人工智能实验室联合上海交通大学、南京大学等机构研发的一套面向SVG全任务的“数据集-基准-模型”一体化综合套件。它基于多模态大语言模型(MLLM)架构,...
Wan2.7-Image是阿里巴巴达摩院通义实验室(通义万相团队)发布的新一代 AI图像生成与编辑统一模型,该模型彻底打破传统AI生图工具"生成与编辑分离"的架构壁垒,将文生图、图...
LongCat-AudioDiT是美团LongCat开源的基于扩散模型的高保真文本转语音(TTS)与零样本语音克隆模型,是当前语音合成领域的SOTA(State-of-the-Art)方案之一。该模型彻底革...
本文深度测评5款免费好用的AI数据标注工具,涵盖Label Studio、LabelImg、LabelMe、Make Sense、Doccano,从功能、场景、易用性、AI辅助能力等维度对比,帮个人开发者、算法...
2026年数据标注行业全景解析:深度揭秘数据标注员真实薪资(3000-50000元)、技能要求及职业发展路径。从基础标注到AI训练师、算法工程师的晋升指南,分析自动化冲击下的转...
