AI新闻资讯 - 最新人工智能技术动态与热点资讯

Paper2Any：开源科研创作助手，一键实现论文转绘图、PPT与智能美化

Paper2Any是OpenDCAI团队推出的一款开源多模态科研创作辅助工具，支持从论文PDF、截图、文本等多种输入形式，一键生成可编辑的模型架构图、技术路线图、实验数据图等科研绘...

2个月前 dotaai

251

TuriX-CUA：开源AI桌面自动化工具，模拟人类操作完成复杂桌面任务

TuriX-CUA（TuriX Computer Use Agent）是一款开源的AI驱动桌面自动化代理工具，核心依托视觉语言模型（VLM）实现端到端的桌面操作自动化，无需依赖应用专属API，可完全模拟...

2个月前 97ai

592

DLCM：字节跳动开源的动态大概念模型，自适应语义压缩与高效概念级推理

DLCM（Dynamic Large Concept Models）是字节跳动等机构联合推出的开源分层语言建模框架，打破传统LLM的token级均匀计算范式，通过端到端学习语义边界，将计算资源从冗余to...

2个月前 AI工具集

85

MiroThinker：MiroMind开源的搜索智能体方案，交互式缩放突破大模型推理瓶颈

MiroThinker是MiroMind研究院推出的开源搜索智能体（Search Agent）项目，聚焦增强工具辅助推理与信息检索能力，通过“交互式缩放”技术突破传统大模型性能瓶颈，提供多参数...

2个月前 AI工具箱

227

TeleChat3：中国电信开源的国产算力大语言模型（LLM）项目

TeleChat3 是中国电信人工智能研究院依托全国产算力研发的开源大语言模型（LLM）项目，聚焦 TeleChat3 系列模型（105B-A4.7B-Thinking、36B-Thinking）的推理、微调、国产化...

2个月前人工智能研究所

122

PersonaLive：开源实时AI人像动画框架，低延迟高帧率数字人直播解决方案

PersonaLive是一款面向实时数字人交互场景的开源AI框架，核心定位是“低门槛、高性能的实时人像动画生成工具”，由澳门大学、dzine.ai与大湾区大学GVC实验室联合研发并开源...

2个月前 AI铺子

138

Computer Use Preview：谷歌开源的AI浏览器自动化工具，自然语言掌控网页操作

Computer Use Preview 是谷歌开源的 AI 驱动型计算机操作工具，基于 Gemini 大模型实现自然语言指令转浏览器自动化操作。支持本地 Playwright 与 Browserbase 云浏览器双环...

2个月前 dotaai

113

Yume：开源现实世界模型，多模态输入生成交互式动态视频世界

Yume是一款开源的现实世界模型项目，聚焦于通过文本、图像或视频等多模态输入创建交互式、逼真且动态的视频世界，核心目标是构建一套完整的现实世界模型体系，涵盖数据层、...

2个月前 97ai

77

IQuest-Coder-V1：九坤投资开源的高性能代码生成与软件工程AI大模型

IQuest-Coder-V1是一套专注于代码生成、代码理解与软件工程全流程任务的开源大语言模型系列，由国内量化私募头部机构九坤投资旗下至知创新研究院独立开发并开源。作为聚焦垂...

2个月前 dotaai

150

RedInk（红墨）：AI驱动的小红书图文创作工具，一键生成风格统一的封面与内容页

RedInk（中文名：红墨）是一款面向内容创作者的开源AI图文创作工具，核心定位是解决小红书等社交平台图文创作效率低、风格不统一、内容构思难等问题。该项目以“一句话生成...

2个月前 AI工具集

113

AI新闻

热门人工智能技术动态与AI行业资讯

Paper2Any：开源科研创作助手，一键实现论文转绘图、PPT与智能美化

TuriX-CUA：开源AI桌面自动化工具，模拟人类操作完成复杂桌面任务

DLCM：字节跳动开源的动态大概念模型，自适应语义压缩与高效概念级推理

MiroThinker：MiroMind开源的搜索智能体方案，交互式缩放突破大模型推理瓶颈

TeleChat3：中国电信开源的国产算力大语言模型（LLM）项目

PersonaLive：开源实时AI人像动画框架，低延迟高帧率数字人直播解决方案

Computer Use Preview：谷歌开源的AI浏览器自动化工具，自然语言掌控网页操作

Yume：开源现实世界模型，多模态输入生成交互式动态视频世界

IQuest-Coder-V1：九坤投资开源的高性能代码生成与软件工程AI大模型

RedInk（红墨）：AI驱动的小红书图文创作工具，一键生成风格统一的封面与内容页