AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
人工智能研究所

人工智能研究所

发现AI神器,探索AI技术!

113投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    Hunyuan3D-Omni:腾讯混元开源的多模态条件控制 3D 资产生成框架

    Hunyuan3D-Omni:腾讯混元开源的多模态条件控制 3D 资产生成框架

    Hunyuan3D-Omni是腾讯混元团队推出的开源3D资产生成框架,该框架通过统一的控制编码器,能够接收多种不同类型的控制信号,实现对3D资产生成过程的精确引导。。它不仅能根据...

    2个月前 人工智能研究所
    11
    一文读懂 5 种 AI Agent 模式:技术原理 + 典型案例深度解析

    一文读懂 5 种 AI Agent 模式:技术原理 + 典型案例深度解析

    在大模型技术持续突破的当下,AI Agent(人工智能代理)正从实验室走向产业落地,成为串联技术能力与实际场景的关键纽带。它不止是效率工具,更在重塑复杂任务的解决路径。...

    2个月前 人工智能研究所
    8
    LongCat-Flash-Chat:美团推出的高性能大语言模型聊天系统

    LongCat-Flash-Chat:美团推出的高性能大语言模型聊天系统

    LongCat-Flash-Chat 是美团开源的一款高性能大语言模型聊天系统,基于 LongCat-Flash 大模型架构构建。该项目旨在提供一个高性能、低延迟、可扩展的大语言模型聊天解决方案...

    2个月前 人工智能研究所
    14
    AudioFly:科大讯飞开源的高性能文本到音频生成模型

    AudioFly:科大讯飞开源的高性能文本到音频生成模型

    AudioFly是由科大讯飞开源的文本驱动音频生成模型,基于Latent Diffusion Model架构构建,具备10亿参数规模。该模型可依据文本描述合成采样率为44.1kHz的高质量音效,在单事...

    2个月前 人工智能研究所
    17
    FLM-Audio:原生全双工音语融合模型,支持中英文低延迟对话交互

    FLM-Audio:原生全双工音语融合模型,支持中英文低延迟对话交互

    FLM-Audio 是一款开源的音频 - 语言融合模型,作为 RoboEgo/FLM-Ego 的子版本,具备原生全双工能力,可同时实现监听、说话与内部独白构建,支持中英文双语言环境下的低延迟...

    2个月前 人工智能研究所
    11
    让AI为你“开口说话”!B站黑科技IndexTTS2本地部署全攻略

    让AI为你“开口说话”!B站黑科技IndexTTS2本地部署全攻略

    B站最新开源的语音合成项目IndexTTS2正在掀起一场AI配音革命!它支持高精度音视频同步、多情感语调切换和本地化部署,是打造虚拟主播、数字人、AI客服的理想选择。本文将手把...

    2个月前 人工智能研究所
    44
    MeloTTS:MyShell AI 推出的开源多语言文本转语音引擎

    MeloTTS:MyShell AI 推出的开源多语言文本转语音引擎

    MeloTTS 是由 MyShell AI 开发的开源文本转语音(TTS)项目,基于先进的深度学习技术,提供高质量、多语言的语音合成能力。该项目支持英语、中文、日语、韩语等多种语言,可...

    2个月前 人工智能研究所
    10
    5款提升效率的VSCode AI插件推荐,助你编程如飞、事半功倍

    5款提升效率的VSCode AI插件推荐,助你编程如飞、事半功倍

    本文精选了五款基于深度学习的 VSCode AI 插件——TabNine、CodeGeeX、Codeium、IntelliCode 和 GitHub Copilot,它们能够根据上下文智能补全代码、生成函数逻辑、优化开发...

    2个月前 人工智能研究所
    16
    AI本地部署与自主训练完整操作指南:从环境搭建到模型优化实战

    AI本地部署与自主训练完整操作指南:从环境搭建到模型优化实战

    相较于云端服务,本地部署AI可避免网络延迟、数据泄露风险,并支持离线运行。本文AI铺子以PyTorch框架为例,系统梳理从环境搭建、数据准备、模型训练到优化的全流程操作,涵...

    2个月前 人工智能研究所
    67
    Matrix-3D:昆仑万维(SkyworkAI)开源的全向可探索 3D 世界生成框架

    Matrix-3D:昆仑万维(SkyworkAI)开源的全向可探索 3D 世界生成框架

    Matrix-3D是由昆仑万维(SkyworkAI)开发的开源3D场景生成框架,专注于实现“全向可探索3D世界”的构建。该项目通过融合全景表示技术、条件视频生成模型与全景3D重建算法,支...

    2个月前 人工智能研究所
    3
  • 上一页
  • 8
  • 9
  • 10
  • 11
  • 12
  • 下一页

最新文章

Wan-Animate:阿里通义实验室推出的 AI 角色动画生成与视频角色替换框架

2025-12-16 AI新闻

联邦学习(FL)入门指南:从零理解分布式AI训练新模式

2025-12-16 AI教程

LightX2V:轻量级视频生成推理框架,高性能多模态视频合成与高效部署解决方案

2025-12-16 AI新闻

UnityVideo:港科大 & 清华 & 快手可灵联合开源的视频理解与生成框架

2025-12-16 AI新闻

LLaDA2.0:蚂蚁集团开源的大参数扩散型生成式 AI 模型

2025-12-16 AI新闻

什么是联邦学习(Federated Learning, FL)?

2025-12-15 AI教程

热门工具

飞象老师:猿辅导专为教师研发的AI教学动画与课件生成工具

飞象老师

飞象老师是猿辅导集团推出的国内首个面向中小学教师群体、专注于教学内容创作的AI专业工具平台。该平台以“赋能教师、减负增效”为核心理念,...
Hum to Search:AI哼唱识曲神器,无需下载即开即用的在线音乐识别平台

Hum to Search

Hum to Search 是一款基于AI技术的在线音乐识别工具,专为解决“旋律在脑中却不知歌名”的困扰而设计。用户只需通过浏览器打开Hum to Search官...
WPS灵犀:金山办公(WPS Office)推出的AI智能辅助写作与PPT生成工具

WPS灵犀

WPS灵犀是金山办公(WPS Office)旗下推出的AI智能辅助写作与PPT生成工具,依托人工智能大模型技术,专注于帮助用户高效生成PPT、文档、报告等...
ZenMux:高性价比AI API 网关平台,支持多个大模型调用与智能容灾

ZenMux

ZenMux 是一个面向开发者与企业的生成式人工智能(GenAI)API 网关平台,它聚合了全球顶级大模型(如 Qwen3-Max、MetaGPT 等)的“超级接入层...
文优小助:AI驱动的学术写作智能助手,一键生成文献综述、开题报告与论文初稿

文优小助

文优小助是一款专注于学术场景的人工智能写作助手,定位于高校学生、科研人员及教育工作者,旨在降低学术写作门槛,提高内容产出效率。它不是...
iMini AI:全栈式AI智能助手平台,集成幻灯片生成、深度研究、文档处理、视频与图像创作

iMini AI

iMini AI 是一个基于人工智能技术打造的多模态超级智能助手订阅平台,致力于为用户提供从内容创作到智能研究的一站式AI解决方案。该平台整合了...
© 2025 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜