AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
AI铺子

AI铺子

关注ai行业发展,专注ai工具推荐

314投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    Stable Video Infinity:开源超长视频生成框架,突破视频长度限制

    Stable Video Infinity:开源超长视频生成框架,突破视频长度限制

    Stable Video Infinity(简称 SVI)是由 EPFL 旗下 VITA 实验室开发的开源超长视频生成项目,核心依托 “Error Recycling(误差回收)” 技术,突破传统视频生成的长度限制...

    5个月前 AI铺子
    326
    RayAI:开源AI智能体运行时框架,支持分布式部署与安全沙箱执行

    RayAI:开源AI智能体运行时框架,支持分布式部署与安全沙箱执行

    RayAI是一款基于Ray分布式计算框架构建的智能体运行时框架,专为AI智能体、MCP服务器和代码沙箱场景设计。它以分布式架构为核心,提供框架无关的兼容性、安全隔离的代码执行...

    5个月前 AI铺子
    112
    PersonaLive:开源实时AI人像动画框架,低延迟高帧率数字人直播解决方案

    PersonaLive:开源实时AI人像动画框架,低延迟高帧率数字人直播解决方案

    PersonaLive是一款面向实时数字人交互场景的开源AI框架,核心定位是“低门槛、高性能的实时人像动画生成工具”,由澳门大学、dzine.ai与大湾区大学GVC实验室联合研发并开源...

    5个月前 AI铺子
    273
    Spatia:基于3D场景点云和动态-静态解纠缠的开源视频生成框架

    Spatia:基于3D场景点云和动态-静态解纠缠的开源视频生成框架

    Spatia是一款由悉尼大学、微软研究院等机构联合研发的开源视频生成框架,核心优势在于通过持久化3D场景点云构建可更新的空间记忆,结合动态-静态解纠缠设计,解决了传统视频...

    5个月前 AI铺子
    140
    MAI-UI:阿里通义推出的开源 GUI 智能体框架,赋能移动场景人机交互革新

    MAI-UI:阿里通义推出的开源 GUI 智能体框架,赋能移动场景人机交互革新

    MAI-UI是阿里通义实验室推出的开源基础GUI智能体项目,核心定位是以现实世界为中心的全尺寸Foundation GUI Agents,聚焦移动场景的人机交互革新,旨在解决传统GUI智能体在实...

    5个月前 AI铺子
    185
    MedASR:谷歌开源的医疗场景专属自动语音识别模型

    MedASR:谷歌开源的医疗场景专属自动语音识别模型

    MedASR是谷歌健康团队开源的医疗领域专用自动语音识别模型,核心聚焦临床语音转文本场景,解决通用ASR模型医疗术语识别不准、误判率高的痛点。该模型基于轻量化Conformer架...

    5个月前 AI铺子
    194
    Qwen-Image-Layered:阿里通义千问开源的AI图像分层编辑模型

    Qwen-Image-Layered:阿里通义千问开源的AI图像分层编辑模型

    Qwen-Image-Layered是阿里巴巴通义千问团队(QwenLM)开源的一款专注于图像分层与精准编辑的AI模型,是当前业内首个实现“原生图层解耦”的开源扩散模型,核心定位是让AI具...

    5个月前 AI铺子
    203
    LongCat-Video-Avatar:美团开源的多任务音频驱动动画生成模型

    LongCat-Video-Avatar:美团开源的多任务音频驱动动画生成模型

    LongCat-Video-Avatar 是美团开源的统一音频驱动角色动画模型,支持音频 - 文本到视频、音频 - 文本 - 图像到视频及视频续播三大核心任务,兼容单流与多流音频输入。该模型...

    5个月前 AI铺子
    108
    什么是预训练(Pre-training)?

    什么是预训练(Pre-training)?

    在人工智能和机器学习领域,预训练(Pre-training)作为一种重要的技术手段,正发挥着日益关键的作用。本文AI铺子将深入探讨预训练的定义、原理、方法、应用场景以及面临的...

    5个月前 AI铺子
    228
    Liquid Audio:Liquid AI开源的低延迟语音到语音基础模型,支持实时多模态交互

    Liquid Audio:Liquid AI开源的低延迟语音到语音基础模型,支持实时多模态交互

    Liquid Audio是Liquid AI推出的开源端到端语音到语音基础模型项目,核心模型为LFM2-Audio-1.5B。该项目以低延迟为设计理念,基于轻量级LFM2骨干网络,支持实时语音到语音对...

    5个月前 AI铺子
    101
  • 上一页
  • 10
  • 11
  • 12
  • 13
  • 14
  • 下一页

最新文章

LumenX Studio:阿里巴巴开源的全链路AI漫剧自动化生产工具

2026-06-10 AI新闻

Manga Image Translator:开源漫画图像翻译工具,自动识别擦除文字并智能重绘译文

2026-06-10 AI新闻

深度解析 GPT-4o 与 Gemini 2.0 Flash:哪款模型更适合你的 AI 应用?

2026-06-10 AI教程

ACTalker:开源多模态说话人视频生成框架,精准驱动面部表情与唇形同步

2026-06-10 AI新闻

PlanningBench:腾讯混元开源大模型规划能力评测与训练框架

2026-06-10 AI新闻

PawBench:阿里通义开源的全链路AI智能体自动化评测基准

2026-06-09 AI新闻

热门工具

万镜一刻:阿里云打造的AI视频创作平台,实现从剧本到成片的全流程覆盖

万镜一刻

万镜一刻是阿里云正在内测的一款AI视频创作工具,其核心定位是为不同需求的创作者提供从内容解析到故事板生成,乃至最终成片的一站式解决方案...
AnyToCopy:支持150+平台的AI智能视频文案提取与去水印工具

AnyToCopy

AnyToCopy是一款基于人工智能技术驱动的多功能在线内容提取工具,专注于为用户提供跨平台视频、图片内容解析服务。致力于解决用户在短视频时代...
TransPocket:AI驱动的智能语音转文字与翻译平台

TransPocket

TransPocket 是一款基于先进人工智能技术打造的在线音频视频转文字服务工具,致力于为用户提供高效、精准、安全的语音内容数字化解决方案。依...
OpenClaw:开源本地AI智能助手,直接操控电脑,自动处理邮件与日常事务

OpenClaw

OpenClaw(原名ClawdBot和Moltbot)是一款开源、本地优先、可完全自托管的个人AI智能体(Personal AI Agent)平台。它不是一款传统意义上的聊...
飞象老师:猿辅导专为教师研发的AI教学动画与课件生成工具

飞象老师

飞象老师是猿辅导集团推出的国内首个面向中小学教师群体、专注于教学内容创作的AI专业工具平台。该平台以“赋能教师、减负增效”为核心理念,...
遨虾:1688推出的AI跨境电商Agent,自动选爆品、秒出商品图,助力卖家高效出海

遨虾

遨虾是1688平台专为跨境电商打造的AI智能体(Agent),整合了AI选品、AI找商、AI素材生成、AI询盘处理四大核心模块,覆盖跨境贸易从“发现机会”...
© 2026 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜