AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
AI铺子

AI铺子

关注ai行业发展,专注ai工具推荐

213投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    PersonaLive:开源实时AI人像动画框架,低延迟高帧率数字人直播解决方案

    PersonaLive:开源实时AI人像动画框架,低延迟高帧率数字人直播解决方案

    PersonaLive是一款面向实时数字人交互场景的开源AI框架,核心定位是“低门槛、高性能的实时人像动画生成工具”,由澳门大学、dzine.ai与大湾区大学GVC实验室联合研发并开源...

    2周前 AI铺子
    110
    Spatia:基于3D场景点云和动态-静态解纠缠的开源视频生成框架

    Spatia:基于3D场景点云和动态-静态解纠缠的开源视频生成框架

    Spatia是一款由悉尼大学、微软研究院等机构联合研发的开源视频生成框架,核心优势在于通过持久化3D场景点云构建可更新的空间记忆,结合动态-静态解纠缠设计,解决了传统视频...

    3周前 AI铺子
    89
    MAI-UI:阿里通义推出的开源 GUI 智能体框架,赋能移动场景人机交互革新

    MAI-UI:阿里通义推出的开源 GUI 智能体框架,赋能移动场景人机交互革新

    MAI-UI是阿里通义实验室推出的开源基础GUI智能体项目,核心定位是以现实世界为中心的全尺寸Foundation GUI Agents,聚焦移动场景的人机交互革新,旨在解决传统GUI智能体在实...

    3周前 AI铺子
    93
    MedASR:谷歌开源的医疗场景专属自动语音识别模型

    MedASR:谷歌开源的医疗场景专属自动语音识别模型

    MedASR是谷歌健康团队开源的医疗领域专用自动语音识别模型,核心聚焦临床语音转文本场景,解决通用ASR模型医疗术语识别不准、误判率高的痛点。该模型基于轻量化Conformer架...

    4周前 AI铺子
    84
    Qwen-Image-Layered:阿里通义千问开源的AI图像分层编辑模型

    Qwen-Image-Layered:阿里通义千问开源的AI图像分层编辑模型

    Qwen-Image-Layered是阿里巴巴通义千问团队(QwenLM)开源的一款专注于图像分层与精准编辑的AI模型,是当前业内首个实现“原生图层解耦”的开源扩散模型,核心定位是让AI具...

    1个月前 AI铺子
    78
    LongCat-Video-Avatar:美团开源的多任务音频驱动动画生成模型

    LongCat-Video-Avatar:美团开源的多任务音频驱动动画生成模型

    LongCat-Video-Avatar 是美团开源的统一音频驱动角色动画模型,支持音频 - 文本到视频、音频 - 文本 - 图像到视频及视频续播三大核心任务,兼容单流与多流音频输入。该模型...

    1个月前 AI铺子
    69
    什么是预训练(Pre-training)?

    什么是预训练(Pre-training)?

    在人工智能和机器学习领域,预训练(Pre-training)作为一种重要的技术手段,正发挥着日益关键的作用。本文AI铺子将深入探讨预训练的定义、原理、方法、应用场景以及面临的...

    1个月前 AI铺子
    93
    Liquid Audio:Liquid AI开源的低延迟语音到语音基础模型,支持实时多模态交互

    Liquid Audio:Liquid AI开源的低延迟语音到语音基础模型,支持实时多模态交互

    Liquid Audio是Liquid AI推出的开源端到端语音到语音基础模型项目,核心模型为LFM2-Audio-1.5B。该项目以低延迟为设计理念,基于轻量级LFM2骨干网络,支持实时语音到语音对...

    1个月前 AI铺子
    67
    FlashVSR:开源实时视频超分辨率框架,基于扩散模型实现高效高画质视频增强

    FlashVSR:开源实时视频超分辨率框架,基于扩散模型实现高效高画质视频增强

    FlashVSR 是一款开源的基于扩散模型的实时视频超分辨率框架,主打高效性、可扩展性与高保真度,创新性提出三阶段蒸馏管道与局部约束稀疏注意力机制,解决传统扩散模型视频超...

    1个月前 AI铺子
    70
    MotionEdit:腾讯 AI 与 UCLA 联合开源的运动感知图像编辑数据集与训练框架

    MotionEdit:腾讯 AI 与 UCLA 联合开源的运动感知图像编辑数据集与训练框架

    MotionEdit是由腾讯AI(西雅图)与加州大学洛杉矶分校联合开发的开源运动中心图像编辑项目,包含MotionEdit-Bench专用基准数据集与MotionNFT(Motion-guided Negative-awar...

    1个月前 AI铺子
    71
  • 上一页
  • 1
  • 2
  • 3
  • 4
  • 5
  • 下一页

最新文章

AgentCPM-Report:开源离线AI深度研究报告生成工具,本地部署生成专业长文报告

2026-01-25 AI新闻

VibeVoice-ASR:微软开源的AI语音转文本工具,单遍处理60分钟长音频

2026-01-25 AI新闻

Qwen3-TTS:通义千问开源的AI语音合成模型,实现多语种语音生成与定制化音色创作

2026-01-25 AI新闻

Step3-VL-10B:阶跃星辰开源的10B参数轻量多模态基础模型

2026-01-24 AI新闻

GLM-4.7-Flash:智谱开源的 30B 级轻量化混合专家模型,支持本地部署与多场景应用

2026-01-24 AI新闻

PersonaPlex:英伟达开源的全双工实时语音对话模型,支持角色定制与自然打断交互

2026-01-24 AI新闻

热门工具

飞象老师:猿辅导专为教师研发的AI教学动画与课件生成工具

飞象老师

飞象老师是猿辅导集团推出的国内首个面向中小学教师群体、专注于教学内容创作的AI专业工具平台。该平台以“赋能教师、减负增效”为核心理念,...
Hum to Search:AI哼唱识曲神器,无需下载即开即用的在线音乐识别平台

Hum to Search

Hum to Search 是一款基于AI技术的在线音乐识别工具,专为解决“旋律在脑中却不知歌名”的困扰而设计。用户只需通过浏览器打开Hum to Search官...
文优小助:AI驱动的学术写作智能助手,一键生成文献综述、开题报告与论文初稿

文优小助

文优小助是一款专注于学术场景的人工智能写作助手,定位于高校学生、科研人员及教育工作者,旨在降低学术写作门槛,提高内容产出效率。它不是...
Z Code:智谱AI推出的轻量级AI代码编辑器,一键切换多模型编程

Z Code

Z Code 是由国内领先的人工智能公司——智谱AI推出的一款轻量级、可视化、集成式AI代码编辑器。它专为开发者设计,旨在解决当前主流AI编程工具...
ZenMux:高性价比AI API 网关平台,支持多个大模型调用与智能容灾

ZenMux

ZenMux 是一个面向开发者与企业的生成式人工智能(GenAI)API 网关平台,它聚合了全球顶级大模型(如 Qwen3-Max、MetaGPT 等)的“超级接入层...
灵光网页版:蚂蚁集团推出的全模态通用AI助手和闪应用生成平台

灵光网页版

灵光网页版是蚂蚁集团旗下全新推出的全模态通用人工智能助手,该产品依托蚂蚁在AI大模型和自然语言处理领域的深厚积累,支持通过自然语言快速...
© 2026 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜