AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
AI铺子

AI铺子

关注ai行业发展,专注ai工具推荐

240投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    MedASR:谷歌开源的医疗场景专属自动语音识别模型

    MedASR:谷歌开源的医疗场景专属自动语音识别模型

    MedASR是谷歌健康团队开源的医疗领域专用自动语音识别模型,核心聚焦临床语音转文本场景,解决通用ASR模型医疗术语识别不准、误判率高的痛点。该模型基于轻量化Conformer架...

    2个月前 AI铺子
    109
    Qwen-Image-Layered:阿里通义千问开源的AI图像分层编辑模型

    Qwen-Image-Layered:阿里通义千问开源的AI图像分层编辑模型

    Qwen-Image-Layered是阿里巴巴通义千问团队(QwenLM)开源的一款专注于图像分层与精准编辑的AI模型,是当前业内首个实现“原生图层解耦”的开源扩散模型,核心定位是让AI具...

    2个月前 AI铺子
    101
    LongCat-Video-Avatar:美团开源的多任务音频驱动动画生成模型

    LongCat-Video-Avatar:美团开源的多任务音频驱动动画生成模型

    LongCat-Video-Avatar 是美团开源的统一音频驱动角色动画模型,支持音频 - 文本到视频、音频 - 文本 - 图像到视频及视频续播三大核心任务,兼容单流与多流音频输入。该模型...

    2个月前 AI铺子
    71
    什么是预训练(Pre-training)?

    什么是预训练(Pre-training)?

    在人工智能和机器学习领域,预训练(Pre-training)作为一种重要的技术手段,正发挥着日益关键的作用。本文AI铺子将深入探讨预训练的定义、原理、方法、应用场景以及面临的...

    2个月前 AI铺子
    127
    Liquid Audio:Liquid AI开源的低延迟语音到语音基础模型,支持实时多模态交互

    Liquid Audio:Liquid AI开源的低延迟语音到语音基础模型,支持实时多模态交互

    Liquid Audio是Liquid AI推出的开源端到端语音到语音基础模型项目,核心模型为LFM2-Audio-1.5B。该项目以低延迟为设计理念,基于轻量级LFM2骨干网络,支持实时语音到语音对...

    2个月前 AI铺子
    72
    FlashVSR:开源实时视频超分辨率框架,基于扩散模型实现高效高画质视频增强

    FlashVSR:开源实时视频超分辨率框架,基于扩散模型实现高效高画质视频增强

    FlashVSR 是一款开源的基于扩散模型的实时视频超分辨率框架,主打高效性、可扩展性与高保真度,创新性提出三阶段蒸馏管道与局部约束稀疏注意力机制,解决传统扩散模型视频超...

    2个月前 AI铺子
    78
    MotionEdit:腾讯 AI 与 UCLA 联合开源的运动感知图像编辑数据集与训练框架

    MotionEdit:腾讯 AI 与 UCLA 联合开源的运动感知图像编辑数据集与训练框架

    MotionEdit是由腾讯AI(西雅图)与加州大学洛杉矶分校联合开发的开源运动中心图像编辑项目,包含MotionEdit-Bench专用基准数据集与MotionNFT(Motion-guided Negative-awar...

    2个月前 AI铺子
    80
    联邦学习(FL)入门指南:从零理解分布式AI训练新模式

    联邦学习(FL)入门指南:从零理解分布式AI训练新模式

    本文AI铺子将带你从零开始,逐步揭开联邦学习(Federated Learning,)的神秘面纱,深入理解其基本原理、核心架构、典型类型与实际应用场景,助你快速掌握这一前沿技术的基础...

    2个月前 AI铺子
    161
    Wan-Move:阿里通义实验室推出的开源运动可控视频生成框架

    Wan-Move:阿里通义实验室推出的开源运动可控视频生成框架

    Wan-Move是由阿里通义实验室、清华大学、香港大学及香港中文大学等联合开源的运动可控视频生成框架,是人工智能领域顶会NeurIPS 2025的收录研究成果,核心定位是解决传统图...

    2个月前 AI铺子
    123
    Kaleido:智谱AI开源的多主体参考视频生成模型

    Kaleido:智谱AI开源的多主体参考视频生成模型

    Kaleido是由智谱AI、合肥工业大学、清华大学等机构联合研发的开源多主体参考视频生成模型,该模型支持512P分辨率视频生成,提供完整的训练、推理代码及预训练权重,适配Pyt...

    2个月前 AI铺子
    133
  • 上一页
  • 3
  • 4
  • 5
  • 6
  • 7
  • 下一页

最新文章

AI龙虾是什么意思?普通人适合养龙虾吗?

2026-03-11 AI教程

HiClaw:开源AI智能体团队系统,IM可视化管控与安全多智能体协同

2026-03-11 AI新闻

肉包(Roubao):无需电脑的开源AI手机自动化助手,自然语言操控全场景任务

2026-03-11 AI新闻

Symphony:OpenAI开源编码智能体编排框架,自动化任务调度与安全执行

2026-03-11 AI新闻

JadeAI:开源AI智能简历生成工具,拖拽编辑+AI全链路优化与多格式一键导出

2026-03-11 AI新闻

HY-WU:腾讯混元开源的功能性神经记忆框架,实现实时参数生成与文本引导图像编辑

2026-03-10 AI新闻

热门工具

OpenClaw:开源本地AI智能助手,直接操控电脑,自动处理邮件与日常事务

OpenClaw

OpenClaw(原名ClawdBot和Moltbot)是一款开源、本地优先、可完全自托管的个人AI智能体(Personal AI Agent)平台。它不是一款传统意义上的聊...
飞象老师:猿辅导专为教师研发的AI教学动画与课件生成工具

飞象老师

飞象老师是猿辅导集团推出的国内首个面向中小学教师群体、专注于教学内容创作的AI专业工具平台。该平台以“赋能教师、减负增效”为核心理念,...
Hum to Search:AI哼唱识曲神器,无需下载即开即用的在线音乐识别平台

Hum to Search

Hum to Search 是一款基于AI技术的在线音乐识别工具,专为解决“旋律在脑中却不知歌名”的困扰而设计。用户只需通过浏览器打开Hum to Search官...
A2E AI:免费无限制AI视频生成平台,集成图像/语音/视频多模态创作工具

A2E AI

A2E AI是全球首个真正实现“免费无限制+隐私优先”的全链路AI视频创作平台,以“让每个人都能轻松制作专业级视频”为使命,整合文本、图像、语...
NiceVoice:AI驱动的在线声音克隆与个性化语音生成平台

NiceVoice

NiceVoice 是一款基于先进人工智能技术开发的在线声音克隆服务平台,通过深度学习和声纹建模技术,NiceVoice 能够仅凭用户提供的简短语音样本...
Z Code:智谱AI推出的轻量级AI代码编辑器,一键切换多模型编程

Z Code

Z Code 是由国内领先的人工智能公司——智谱AI推出的一款轻量级、可视化、集成式AI代码编辑器。它专为开发者设计,旨在解决当前主流AI编程工具...
© 2026 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜