AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜
  • 简体中文
  • English

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
人工智能研究所

人工智能研究所

发现AI神器,探索AI技术!

65投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    StableAvatar:音频驱动的无限长度虚拟人视频生成框架

    StableAvatar:音频驱动的无限长度虚拟人视频生成框架

    StableAvatar 是一个专注于音频驱动的无限长度虚拟人视频生成的开源项目,能够基于参考图像和音频,合成具有身份一致性、自然音频同步的长视频,无需依赖人脸交换或修复等后...

    3周前 人工智能研究所
    7
    Context7 MCP:实时代码文档增强与上下文注入的开源MCP服务器

    Context7 MCP:实时代码文档增强与上下文注入的开源MCP服务器

    Context7 MCP 是一个开源的 Model Context Protocol 服务器,旨在解决大语言模型(LLM)在生成代码时面临的信息过时和上下文不足问题。它为 AI 编程工具提供实时、版本特定的...

    3周前 人工智能研究所
    7
    让GPT写出“人话”:15个反AI痕迹提示词实战手册

    让GPT写出“人话”:15个反AI痕迹提示词实战手册

    在人工智能内容生成领域,用户对“AI味”的敏感度持续攀升。机械化的转折词、堆砌的术语、生硬的逻辑框架,已成为阻碍内容传播的三大痛点。本文AI铺子提炼出15个可直接复用...

    3周前 人工智能研究所
    3
    Hunyuan3D-Omni:腾讯混元开源的多模态条件控制 3D 资产生成框架

    Hunyuan3D-Omni:腾讯混元开源的多模态条件控制 3D 资产生成框架

    Hunyuan3D-Omni是腾讯混元团队推出的开源3D资产生成框架,该框架通过统一的控制编码器,能够接收多种不同类型的控制信号,实现对3D资产生成过程的精确引导。。它不仅能根据...

    3周前 人工智能研究所
    8
    一文读懂 5 种 AI Agent 模式:技术原理 + 典型案例深度解析

    一文读懂 5 种 AI Agent 模式:技术原理 + 典型案例深度解析

    在大模型技术持续突破的当下,AI Agent(人工智能代理)正从实验室走向产业落地,成为串联技术能力与实际场景的关键纽带。它不止是效率工具,更在重塑复杂任务的解决路径。...

    3周前 人工智能研究所
    5
    LongCat-Flash-Chat:美团推出的高性能大语言模型聊天系统

    LongCat-Flash-Chat:美团推出的高性能大语言模型聊天系统

    LongCat-Flash-Chat 是美团开源的一款高性能大语言模型聊天系统,基于 LongCat-Flash 大模型架构构建。该项目旨在提供一个高性能、低延迟、可扩展的大语言模型聊天解决方案...

    3周前 人工智能研究所
    3
    AudioFly:科大讯飞开源的高性能文本到音频生成模型

    AudioFly:科大讯飞开源的高性能文本到音频生成模型

    AudioFly是由科大讯飞开源的文本驱动音频生成模型,基于Latent Diffusion Model架构构建,具备10亿参数规模。该模型可依据文本描述合成采样率为44.1kHz的高质量音效,在单事...

    3周前 人工智能研究所
    7
    FLM-Audio:原生全双工音语融合模型,支持中英文低延迟对话交互

    FLM-Audio:原生全双工音语融合模型,支持中英文低延迟对话交互

    FLM-Audio 是一款开源的音频 - 语言融合模型,作为 RoboEgo/FLM-Ego 的子版本,具备原生全双工能力,可同时实现监听、说话与内部独白构建,支持中英文双语言环境下的低延迟...

    3周前 人工智能研究所
    4
    让AI为你“开口说话”!B站黑科技IndexTTS2本地部署全攻略

    让AI为你“开口说话”!B站黑科技IndexTTS2本地部署全攻略

    B站最新开源的语音合成项目IndexTTS2正在掀起一场AI配音革命!它支持高精度音视频同步、多情感语调切换和本地化部署,是打造虚拟主播、数字人、AI客服的理想选择。本文将手把...

    3周前 人工智能研究所
    10
    MeloTTS:MyShell AI 推出的开源多语言文本转语音引擎

    MeloTTS:MyShell AI 推出的开源多语言文本转语音引擎

    MeloTTS 是由 MyShell AI 开发的开源文本转语音(TTS)项目,基于先进的深度学习技术,提供高质量、多语言的语音合成能力。该项目支持英语、中文、日语、韩语等多种语言,可...

    4周前 人工智能研究所
    9
  • 上一页
  • 3
  • 4
  • 5
  • 6
  • 7
  • 下一页

最新文章

LiveCC:开源实时视频解说大模型,融合流式语音转录与多模态理解

2025-10-24 AI新闻

AI辅助编程入门指南:从环境搭建到第一个智能脚本

2025-10-24 AI教程

Katakate:开源轻量级安全 VM 沙箱工具,支持大规模 AI 计算与多场景隔离编排

2025-10-24 AI新闻

Open Notebook:开源隐私优先的研究助手,支持多模态管理与多 AI 模型集成

2025-10-24 AI新闻

ChatGPT Atlas 来了!OpenAI 首款 AI 浏览器落地 macOS,跨页实时辅助 + 代理模式成亮点

2025-10-23 AI新闻

ChopperBot:开源全自动化多平台直播切片机器人,支持智能剪辑与跨平台发布

2025-10-23 AI新闻

热门工具

魔搭社区(ModelScope):一站式AI开源模型与应用生态平台

魔搭社区(ModelScope)

魔搭社区(ModelScope)是一个一站式人工智能开源模型与应用生态平台,致力于为开发者、研究人员和企业提供模型托管、训练、推理、部署及应用搭...
造点AI:夸克推出的智能AI图片与视频生成平台

造点AI

造点AI是由阿里巴巴旗下智能搜索应用“夸克”推出的一款基于生成式人工智能(Generative AI)技术的智能内容创作平台,专注于为用户提供AI图像...
豆包:字节跳动旗下一站式AI智能问答与创作助手

豆包

豆包(Doubao)是由字节跳动推出的一款多功能人工智能助手,旨在为用户提供全方位的生活、学习和工作帮助。作为字节生态中的重要AI产品之一,豆...
可赞AI:可视化AI办公工具,文字秒变图表或脑图

可赞AI

可赞AI是一款集智能写作与可视化办公于一体的AI辅助工具平台,专注于通过人工智能技术帮助用户将文字内容快速转化为图表、脑图、信息图等可视...
Roo Code:开源AI辅助编程插件,支持多模型与实时代码补全

Roo Code

Roo Code 是一款专为现代开发者打造的开源 AI 编程助手插件,旨在通过人工智能技术提升开发效率、优化代码质量,并提供实时、智能的编码辅助。...
椒图AI:在线中文AI修图工具,一句话轻松P图

椒图AI

椒图AI是由武汉枫潮科技有限公司推出的一款基于人工智能的智能图像编辑工具。它专注于通过中文自然语言理解(NLP)与图像生成技术的结合,实现...
© 2025 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜