BabelDOC:开源PDF科学论文翻译库,支持双语对比与复杂内容精准处理
BabelDOC是一款开源的PDF科学论文翻译与双语对比工具,它并非普通的文档翻译工具,而是聚焦学术场景的“专业级解决方案”——针对PDF科学论文中常见的公式、表格、跨页段落...
BabelDOC是一款开源的PDF科学论文翻译与双语对比工具,它并非普通的文档翻译工具,而是聚焦学术场景的“专业级解决方案”——针对PDF科学论文中常见的公式、表格、跨页段落...
Paper2Video是新加坡国立大学Show Lab开发的开源学术工具,通过PaperTalker智能代理,以LaTeX论文源码、参考肖像图及10秒参考音频为输入,自动生成包含结构化幻灯片、时间对...
中国领先的多模态AI创作社区LiblibAI近日宣布推出革命性版本LiblibAI2.0,标志着其从单一工具平台向覆盖创作全链条的生态化系统转型。此次升级以"专业级创作+零门槛体验"为...
近日,开源全能AI对话助手[Cherry Studio]正式推出v1.6.4版本,并首次集成自主研发的CherryIN智能聚合系统。该系统凭借对主流AI模型的深度整合与优化,成为全球首个支持多模...
SongBloom 是腾讯 AILab 开源的全长歌曲生成框架,通过结合自回归草图绘制与扩散模型精炼技术,实现了高质量、风格一致的完整歌曲创作。该框架支持以 10 秒音频为提示,生成...
PromptHelper 是一款开源的油猴脚本,旨在为用户提供跨平台的 AI Prompt 模板管理解决方案。它能够在主流 AI 平台上自动读取输入内容,应用预设模板,大幅提升与 AI 交互的...
AIMedia 是一款开源的全自动 AI 媒体软件,核心定位是解决媒体运营中 “热点获取 - 内容创作 - 多平台发布” 的全流程自动化问题,降低人工成本。该软件支持抓取抖音、微博...
TANGO 是一个由 CyberAgent AI Lab 开发的开源项目,专注于从音频和参考视频生成同步语音手势的全身视频。该项目结合了分层音动嵌入和扩散插值技术,实现了高质量的动作生成...
Androidify 是一个由 Google推出的开源示例应用,展示了如何将 Gemini API、Firebase AI Logic SDK、Jetpack Compose、CameraX、Media3 以及 Wear OS 联动等现代 Android 技...
UserLM-8b是微软研究院开发的开源用户模拟大模型,其核心目标是填补“用户角色模拟”的LLM空白——常规LLM以“助手”身份生成帮助性响应,而UserLM-8b专为模拟“用户”在对...