AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
人工智能研究所

人工智能研究所

发现AI神器,探索AI技术!

183投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    UltraEval-Audio:全球首个开源音频大模型全维度评测框架

    UltraEval-Audio:全球首个开源音频大模型全维度评测框架

    UltraEval-Audio是全球首个开源的音频大模型专属评测框架,聚焦语音理解与语音生成类任务的全维度、标准化评估。该框架聚合34个权威基准数据集,覆盖语音、声音、医疗、音乐...

    3个月前 人工智能研究所
    130
    TeleChat3:中国电信开源的国产算力大语言模型(LLM)项目

    TeleChat3:中国电信开源的国产算力大语言模型(LLM)项目

    TeleChat3 是中国电信人工智能研究院依托全国产算力研发的开源大语言模型(LLM)项目,聚焦 TeleChat3 系列模型(105B-A4.7B-Thinking、36B-Thinking)的推理、微调、国产化...

    3个月前 人工智能研究所
    156
    HY-Motion 1.0:腾讯混元开源的文本到 3D 动作生成模型

    HY-Motion 1.0:腾讯混元开源的文本到 3D 动作生成模型

    HY-Motion 1.0是腾讯混元团队开源的大规模文本到3D人体动作生成模型系列,核心定位是为数字内容创作领域提供高效、高精度的AI驱动动画生成解决方案。它系统性解决了长期困扰...

    3个月前 人工智能研究所
    246
    Qwen-Doc:阿里通义推出的开源长文档处理与智能推理工具集

    Qwen-Doc:阿里通义推出的开源长文档处理与智能推理工具集

    Qwen-Doc是由阿里巴巴通义智文团队开发并开源的专注于文档智能的代码库,不同于常规的文档解析工具,Qwen-Doc核心聚焦大语言模型在长文本、复杂文档场景下的能力提升,解决...

    3个月前 人工智能研究所
    146
    QuantiPhy:开源视觉-语言模型定量物理推理评估基准,精准衡量AI运动学推理能力

    QuantiPhy:开源视觉-语言模型定量物理推理评估基准,精准衡量AI运动学推理能力

    QuantiPhy是首个专注于评估视觉-语言模型(VLMs)定量运动学推理能力的开源评估基准及配套代码库,该项目通过多区域准确率(MRA)核心指标,从难度等级、任务类别等维度衡量...

    4个月前 人工智能研究所
    112
    PaCoRe:阶跃星辰推出的开源AI推理框架,8B小模型性能超越GPT-5

    PaCoRe:阶跃星辰推出的开源AI推理框架,8B小模型性能超越GPT-5

    PaCoRe 全称Parallel Coordinated Reasoning,中文译为并行协同推理,是由阶跃星辰(stepfun-ai)团队开源的一款全新AI推理框架,核心定位是解决传统大模型推理时的两大核心...

    4个月前 人工智能研究所
    105
    什么是LSTM?——深度解析长短期记忆网络的基本原理

    什么是LSTM?——深度解析长短期记忆网络的基本原理

    长短期记忆网络(Long Short-Term Memory, LSTM)是循环神经网络(RNN)的核心改进架构,核心解决传统 RNN 处理长序列时的梯度消失问题。本文将从数学原理、结构创新、工程...

    4个月前 人工智能研究所
    113
    MiMo-V2-Flash:小米开源的千亿级混合专家语言模型,高速推理与长上下文处理兼备

    MiMo-V2-Flash:小米开源的千亿级混合专家语言模型,高速推理与长上下文处理兼备

    MiMo-V2-Flash 是小米公司开源的千亿级混合专家(MoE)架构语言模型,总参数规模达3090亿,活跃参数仅150亿,实现了高性能与低推理成本的平衡。该模型创新采用混合注意力架...

    4个月前 人工智能研究所
    91
    Sana:NVIDIA开源的高效高分辨率AI图像与视频生成框架

    Sana:NVIDIA开源的高效高分辨率AI图像与视频生成框架

    Sana是NVIDIA实验室开源的基于线性扩散Transformer技术的高分辨率图像与视频生成项目,该项目支持512px-4Kpx高清图像生成、分钟级视频生成,通过线性化注意力机制、少步扩散...

    4个月前 人工智能研究所
    89
    VideoLLaMA3:阿里达摩院开源的多模态大模型,高效赋能图像与视频深度理解

    VideoLLaMA3:阿里达摩院开源的多模态大模型,高效赋能图像与视频深度理解

    VideoLLaMA3是由阿里巴巴达摩院新加坡NLP团队研发并开源的多模态基础模型,聚焦于图像与视频的内容理解与分析任务。作为VideoLLaMA系列模型的升级版本,该模型基于字节跳动...

    4个月前 人工智能研究所
    93
  • 上一页
  • 5
  • 6
  • 7
  • 8
  • 9
  • 下一页

最新文章

GBrain:开源个人知识大脑,混合检索驱动AI智能体长效记忆

2026-04-26 AI新闻

Ling-2.6-flash:蚂蚁百灵推出的高智效比AI大模型,主打快速推理与低成本部署

2026-04-26 AI新闻

StepAudio 2.5 ASR:阶跃星辰开源的轻量化语音识别模型

2026-04-26 AI新闻

Claude Design:Anthropic推出的智能AI一体化视觉创作与设计辅助平台

2026-04-26 AI新闻

Seed3D 2.0:字节自研端到端3D生成大模型,高精度几何建模与写实材质一体化生成

2026-04-25 AI新闻

buffett-skills:开源Claude Code专用技能集合,复刻巴菲特投资逻辑

2026-04-25 AI新闻

热门工具

万镜一刻:阿里云打造的AI视频创作平台,实现从剧本到成片的全流程覆盖

万镜一刻

万镜一刻是阿里云正在内测的一款AI视频创作工具,其核心定位是为不同需求的创作者提供从内容解析到故事板生成,乃至最终成片的一站式解决方案...
TransPocket:AI驱动的智能语音转文字与翻译平台

TransPocket

TransPocket 是一款基于先进人工智能技术打造的在线音频视频转文字服务工具,致力于为用户提供高效、精准、安全的语音内容数字化解决方案。依...
OpenClaw:开源本地AI智能助手,直接操控电脑,自动处理邮件与日常事务

OpenClaw

OpenClaw(原名ClawdBot和Moltbot)是一款开源、本地优先、可完全自托管的个人AI智能体(Personal AI Agent)平台。它不是一款传统意义上的聊...
飞象老师:猿辅导专为教师研发的AI教学动画与课件生成工具

飞象老师

飞象老师是猿辅导集团推出的国内首个面向中小学教师群体、专注于教学内容创作的AI专业工具平台。该平台以“赋能教师、减负增效”为核心理念,...
NiceVoice:AI驱动的在线声音克隆与个性化语音生成平台

NiceVoice

NiceVoice 是一款基于先进人工智能技术开发的在线声音克隆服务平台,通过深度学习和声纹建模技术,NiceVoice 能够仅凭用户提供的简短语音样本...
AnyToCopy:支持150+平台的AI智能视频文案提取与去水印工具

AnyToCopy

AnyToCopy是一款基于人工智能技术驱动的多功能在线内容提取工具,专注于为用户提供跨平台视频、图片内容解析服务。致力于解决用户在短视频时代...
© 2026 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜