Paper2Any:开源科研创作助手,一键实现论文转绘图、PPT与智能美化
Paper2Any是OpenDCAI团队推出的一款开源多模态科研创作辅助工具,支持从论文PDF、截图、文本等多种输入形式,一键生成可编辑的模型架构图、技术路线图、实验数据图等科研绘...
Paper2Any是OpenDCAI团队推出的一款开源多模态科研创作辅助工具,支持从论文PDF、截图、文本等多种输入形式,一键生成可编辑的模型架构图、技术路线图、实验数据图等科研绘...
TuriX-CUA(TuriX Computer Use Agent)是一款开源的AI驱动桌面自动化代理工具,核心依托视觉语言模型(VLM)实现端到端的桌面操作自动化,无需依赖应用专属API,可完全模拟...
DLCM(Dynamic Large Concept Models)是字节跳动等机构联合推出的开源分层语言建模框架,打破传统LLM的token级均匀计算范式,通过端到端学习语义边界,将计算资源从冗余to...
MiroThinker是MiroMind研究院推出的开源搜索智能体(Search Agent)项目,聚焦增强工具辅助推理与信息检索能力,通过“交互式缩放”技术突破传统大模型性能瓶颈,提供多参数...
TeleChat3 是中国电信人工智能研究院依托全国产算力研发的开源大语言模型(LLM)项目,聚焦 TeleChat3 系列模型(105B-A4.7B-Thinking、36B-Thinking)的推理、微调、国产化...
PersonaLive是一款面向实时数字人交互场景的开源AI框架,核心定位是“低门槛、高性能的实时人像动画生成工具”,由澳门大学、dzine.ai与大湾区大学GVC实验室联合研发并开源...
Computer Use Preview 是谷歌开源的 AI 驱动型计算机操作工具,基于 Gemini 大模型实现自然语言指令转浏览器自动化操作。支持本地 Playwright 与 Browserbase 云浏览器双环...
Yume是一款开源的现实世界模型项目,聚焦于通过文本、图像或视频等多模态输入创建交互式、逼真且动态的视频世界,核心目标是构建一套完整的现实世界模型体系,涵盖数据层、...
IQuest-Coder-V1是一套专注于代码生成、代码理解与软件工程全流程任务的开源大语言模型系列,由国内量化私募头部机构九坤投资旗下至知创新研究院独立开发并开源。作为聚焦垂...
RedInk(中文名:红墨)是一款面向内容创作者的开源AI图文创作工具,核心定位是解决小红书等社交平台图文创作效率低、风格不统一、内容构思难等问题。该项目以“一句话生成...