97ai的个人主页

Ideogram 4：93 亿参数开源文生图模型，海报 LOGO 一键精准排版出图

Ideogram 4是加拿大AI企业Ideogram AI开源的93亿参数（9.3B）DiT架构文生图大模型，也是Ideogram品牌首款开放模型权重、支持本地私有化部署的商用级开源AI绘图模型。在Desi...

1个月前 97ai

119

OmniVoice Studio：开源本地化 AI 语音工具集，完全替代 ElevenLabs 的免费方案

OmniVoice Studio 是一个完全开源、本地运行的 AI 语音工具集，定位为 ElevenLabs 的替代品。它支持 646 种语言的零样本语音克隆、语音设计（多参数调节）、全流程视频配音...

1个月前 97ai

139

Qwen-Image-Bench：通义千问推出的文生图评测基准，驱动AI绘画能力标准化评估

Qwen-Image-Bench是阿里通义千问团队开源的文生图专业评测基准，配套1000条中英双语分层数据集与自研Q-Judger评估引擎，可对AI绘画模型进行5大核心能力、56项指标的自动化量...

1个月前 97ai

134

阿里云百炼 CLI：阿里云开源的AI命令行工具，一键接入百炼全栈多模态能力

阿里云百炼 CLI是阿里云推出的开源命令行工具，专为AI Agent设计，可一键接入百炼平台150多款模型及知识库、MCP工具等全栈能力。工具支持全平台运行，原生兼容Claude Code、...

1个月前 97ai

144

Aholo Viewer：群核科技开源的高性能3D高斯Web渲染器，亿级场景流畅直渲

Aholo Viewer是群核科技开源的高性能3D高斯Web渲染器，采用Chunked Streaming LoD架构，支持10亿+高斯点城市级场景浏览器直渲，跨手机/PC/VR终端零门槛访问，性能超越Spark...

1个月前 97ai

158

Dograh AI：开源私有化语音AI智能体，拖拽式快速搭建电话机器人

Dograh AI是遵循BSD开源协议的实时语音AI智能体开发平台，支持Docker一键私有化部署，采用拖拽式低代码编辑方式，可快速搭建电话语音机器人。平台兼容多类语音与大语言模型...

1个月前 97ai

126

Free Claude Code：开源免费Claude Code代理工具，多模型替换拓展编码辅助能力

Free Claude Code是一款MIT协议开源的Claude Code专属模型代理工具，支持十余种云端与本地AI模型接入，无缝兼容官方编码交互功能，配备可视化管理面板，全平台均可快速部署...

2个月前 97ai

114

LLM Council：开源多模型议会协同问答工具，匿名互评整合优质答案

LLM Council 是Andrej Karpathy 开源的多模型议会式协作问答系统，项目摒弃传统单一大模型问答模式，模拟议会议事逻辑，将多款主流大语言模型组建为议事委员团队，通过独立...

2个月前 97ai

136

Gemini Omni Flash：谷歌全模态世界模型，推理与创作融合的AI视频生成工具

Gemini Omni Flash是谷歌DeepMind推出的全模态生成式AI模型，支持文本、图片、音频、视频任意组合输入，可生成720P/10秒带同步音频的高清视频。核心具备对话式视频编辑、物...

2个月前 97ai

109

HyperEyes：开源并行多模态搜索智能体框架，双粒度强化学习优化高效检索

HyperEyes是一款开源并行多模态搜索智能体框架，采用双粒度效率感知强化学习技术，支持多实体图文并行检索，内置专属数据集生成方案与IMEB专业评测基准，可大幅减少智能体工...

2个月前 97ai

103

97ai

文章

工具

软件

图书

Ideogram 4：93 亿参数开源文生图模型，海报 LOGO 一键精准排版出图

OmniVoice Studio：开源本地化 AI 语音工具集，完全替代 ElevenLabs 的免费方案

Qwen-Image-Bench：通义千问推出的文生图评测基准，驱动AI绘画能力标准化评估

阿里云百炼 CLI：阿里云开源的AI命令行工具，一键接入百炼全栈多模态能力

Aholo Viewer：群核科技开源的高性能3D高斯Web渲染器，亿级场景流畅直渲

Dograh AI：开源私有化语音AI智能体，拖拽式快速搭建电话机器人

Free Claude Code：开源免费Claude Code代理工具，多模型替换拓展编码辅助能力

LLM Council：开源多模型议会协同问答工具，匿名互评整合优质答案

Gemini Omni Flash：谷歌全模态世界模型，推理与创作融合的AI视频生成工具

HyperEyes：开源并行多模态搜索智能体框架，双粒度强化学习优化高效检索