AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
人工智能研究所

人工智能研究所

发现AI神器,探索AI技术!

150投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    InteractAvatar:面向场景物体交互的开源 AI 说话数字人生成框架

    InteractAvatar:面向场景物体交互的开源 AI 说话数字人生成框架

    InteractAvatar是一款开源的文本驱动、场景感知、人物-物体交互可控的说话数字人(Talking Avatar)生成框架,核心解决当前数字人生成领域长期存在的控制-质量两难问题——...

    3周前 人工智能研究所
    122
    PaddleSpeech:百度飞桨开源的全栈语音 AI 工具包,覆盖识别合成翻译克隆全场景

    PaddleSpeech:百度飞桨开源的全栈语音 AI 工具包,覆盖识别合成翻译克隆全场景

    PaddleSpeech是基于百度飞桨(PaddlePaddle)深度学习框架打造的开源一站式语音与音频全功能处理工具包,该项目的核心定位是降低语音技术的使用与开发门槛,打通从数据处理...

    4周前 人工智能研究所
    93
    SpaceX收购xAI估值1.25万亿美元,马斯克打造太空AI超级闭环

    SpaceX收购xAI估值1.25万亿美元,马斯克打造太空AI超级闭环

    2026年2月,SpaceX正式收购xAI,合并后新实体估值达1.25万亿美元。马斯克宣布构建“太空-地面一体化AI生态”,利用星链卫星与星舰火箭打造轨道数据中心,解决地面算力能源瓶...

    4周前 人工智能研究所
    77
    Multimodal-Search-R1:字节跳动开源的端到端多模态搜索强化学习框架

    Multimodal-Search-R1:字节跳动开源的端到端多模态搜索强化学习框架

    Multimodal-Search-R1(简称MMSearch-R1)是一款开源的端到端强化学习框架,核心定位是让多模态大语言模型(LMMs)具备按需、多轮、自主的真实世界多模态搜索能力,解决传统...

    1个月前 人工智能研究所
    84
    SenseNova-MARS:商汤科技开源的多模态智能体框架,实现动态视觉推理与多工具协同搜索

    SenseNova-MARS:商汤科技开源的多模态智能体框架,实现动态视觉推理与多工具协同搜索

    SenseNova-MARS是商汤科技开源的多模态智能体推理与搜索框架,以强化学习为核心技术,赋予视觉语言模型动态视觉推理与图像裁剪、图像搜索、文本搜索多工具协同调用能力,提...

    1个月前 人工智能研究所
    95
    DeepSpeed-MII:DeepSpeed 团队推出的大模型推理高性能优化与部署工具

    DeepSpeed-MII:DeepSpeed 团队推出的大模型推理高性能优化与部署工具

    DeepSpeed-MII是由微软DeepSpeed团队打造的开源Python大模型推理部署专用库,全称为Model Implementations for Inference,是DeepSpeed生态中聚焦于模型推理阶段的核心组件...

    1个月前 人工智能研究所
    80
    DeepSeek-OCR 2:DeepSeek-AI推出的开源类人逻辑OCR识别工具,适配图片与PDF全场景

    DeepSeek-OCR 2:DeepSeek-AI推出的开源类人逻辑OCR识别工具,适配图片与PDF全场景

    DeepSeek-OCR 2是由deepseek-ai开源的新一代OCR(光学字符识别)模型,基于视觉因果流设计理念,核心是让AI模拟人类阅读逻辑处理图像与文档,该模型采用DeepEncoder V2架构...

    1个月前 人工智能研究所
    218
    OpenJudge:开源AI应用评估与优化框架

    OpenJudge:开源AI应用评估与优化框架

    OpenJudge是一款专为AI应用设计的开源评估框架,基于Python开发,核心定位是为AI智能体、聊天机器人、多模态应用、代码生成系统等各类AI应用提供标准化、自动化、全维度的质...

    1个月前 人工智能研究所
    91
    Step3-VL-10B:阶跃星辰开源的10B参数轻量多模态基础模型

    Step3-VL-10B:阶跃星辰开源的10B参数轻量多模态基础模型

    STEP3-VL-10B是阶跃星辰(StepFun AI)开源的轻量级多模态基础大模型,核心定位是在10B(100亿)参数的紧凑规模下,实现高效性与前沿多模态智能的极致平衡,打破“参数越大...

    1个月前 人工智能研究所
    84
    LightOnOCR-2-1B:LightOnAI开源的10 亿参数开源端到端 OCR 模型

    LightOnOCR-2-1B:LightOnAI开源的10 亿参数开源端到端 OCR 模型

    LightOnOCR-2-1B 是由 LightOnAI 开源的端到端多语言视觉 - 语言 OCR 模型,仅含 10 亿参数,却实现了当前业界领先的识别性能。该模型打破传统多阶段 OCR 流水线的局限,可...

    1个月前 人工智能研究所
    162
  • 上一页
  • 1
  • 2
  • 3
  • 4
  • 5
  • 下一页

最新文章

《斩仙台》六天破亿!AI真人微短剧席卷荧屏,真人演员的“铁饭碗”还端得稳吗?

2026-03-05 AI新闻

FramePack:开源低显存AI长视频生成工具,长视频抗漂移与上下文压缩

2026-03-05 AI新闻

PISCO:稀疏控制驱动的精准视频实例插入框架,高效实现物体添加与动态编辑

2026-03-05 AI新闻

AI绘画工具哪个好?10款国内外热门AI图片生成工具深度测评与详解

2026-03-05 AI教程

Capybara:开源统一视觉创作模型,一站式支持文生图/文生视频/指令级图像视频编辑

2026-03-05 AI新闻

2026 AI编程工具深度对比:Cursor、Copilot、Claude Code、Qoder、Trae与通义灵码…谁才是效率之王?

2026-03-04 AI教程

热门工具

OpenClaw:开源本地AI智能助手,直接操控电脑,自动处理邮件与日常事务

OpenClaw

OpenClaw(原名ClawdBot和Moltbot)是一款开源、本地优先、可完全自托管的个人AI智能体(Personal AI Agent)平台。它不是一款传统意义上的聊...
飞象老师:猿辅导专为教师研发的AI教学动画与课件生成工具

飞象老师

飞象老师是猿辅导集团推出的国内首个面向中小学教师群体、专注于教学内容创作的AI专业工具平台。该平台以“赋能教师、减负增效”为核心理念,...
Hum to Search:AI哼唱识曲神器,无需下载即开即用的在线音乐识别平台

Hum to Search

Hum to Search 是一款基于AI技术的在线音乐识别工具,专为解决“旋律在脑中却不知歌名”的困扰而设计。用户只需通过浏览器打开Hum to Search官...
NiceVoice:AI驱动的在线声音克隆与个性化语音生成平台

NiceVoice

NiceVoice 是一款基于先进人工智能技术开发的在线声音克隆服务平台,通过深度学习和声纹建模技术,NiceVoice 能够仅凭用户提供的简短语音样本...
A2E AI:免费无限制AI视频生成平台,集成图像/语音/视频多模态创作工具

A2E AI

A2E AI是全球首个真正实现“免费无限制+隐私优先”的全链路AI视频创作平台,以“让每个人都能轻松制作专业级视频”为使命,整合文本、图像、语...
Z Code:智谱AI推出的轻量级AI代码编辑器,一键切换多模型编程

Z Code

Z Code 是由国内领先的人工智能公司——智谱AI推出的一款轻量级、可视化、集成式AI代码编辑器。它专为开发者设计,旨在解决当前主流AI编程工具...
© 2026 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜