AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
人工智能研究所

人工智能研究所

发现AI神器,探索AI技术!

150投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    Qwen-Doc:阿里通义推出的开源长文档处理与智能推理工具集

    Qwen-Doc:阿里通义推出的开源长文档处理与智能推理工具集

    Qwen-Doc是由阿里巴巴通义智文团队开发并开源的专注于文档智能的代码库,不同于常规的文档解析工具,Qwen-Doc核心聚焦大语言模型在长文本、复杂文档场景下的能力提升,解决...

    2个月前 人工智能研究所
    93
    QuantiPhy:开源视觉-语言模型定量物理推理评估基准,精准衡量AI运动学推理能力

    QuantiPhy:开源视觉-语言模型定量物理推理评估基准,精准衡量AI运动学推理能力

    QuantiPhy是首个专注于评估视觉-语言模型(VLMs)定量运动学推理能力的开源评估基准及配套代码库,该项目通过多区域准确率(MRA)核心指标,从难度等级、任务类别等维度衡量...

    2个月前 人工智能研究所
    77
    PaCoRe:阶跃星辰推出的开源AI推理框架,8B小模型性能超越GPT-5

    PaCoRe:阶跃星辰推出的开源AI推理框架,8B小模型性能超越GPT-5

    PaCoRe 全称Parallel Coordinated Reasoning,中文译为并行协同推理,是由阶跃星辰(stepfun-ai)团队开源的一款全新AI推理框架,核心定位是解决传统大模型推理时的两大核心...

    2个月前 人工智能研究所
    88
    什么是LSTM?——深度解析长短期记忆网络的基本原理

    什么是LSTM?——深度解析长短期记忆网络的基本原理

    长短期记忆网络(Long Short-Term Memory, LSTM)是循环神经网络(RNN)的核心改进架构,核心解决传统 RNN 处理长序列时的梯度消失问题。本文将从数学原理、结构创新、工程...

    2个月前 人工智能研究所
    95
    MiMo-V2-Flash:小米开源的千亿级混合专家语言模型,高速推理与长上下文处理兼备

    MiMo-V2-Flash:小米开源的千亿级混合专家语言模型,高速推理与长上下文处理兼备

    MiMo-V2-Flash 是小米公司开源的千亿级混合专家(MoE)架构语言模型,总参数规模达3090亿,活跃参数仅150亿,实现了高性能与低推理成本的平衡。该模型创新采用混合注意力架...

    2个月前 人工智能研究所
    75
    Sana:NVIDIA开源的高效高分辨率AI图像与视频生成框架

    Sana:NVIDIA开源的高效高分辨率AI图像与视频生成框架

    Sana是NVIDIA实验室开源的基于线性扩散Transformer技术的高分辨率图像与视频生成项目,该项目支持512px-4Kpx高清图像生成、分钟级视频生成,通过线性化注意力机制、少步扩散...

    2个月前 人工智能研究所
    73
    VideoLLaMA3:阿里达摩院开源的多模态大模型,高效赋能图像与视频深度理解

    VideoLLaMA3:阿里达摩院开源的多模态大模型,高效赋能图像与视频深度理解

    VideoLLaMA3是由阿里巴巴达摩院新加坡NLP团队研发并开源的多模态基础模型,聚焦于图像与视频的内容理解与分析任务。作为VideoLLaMA系列模型的升级版本,该模型基于字节跳动...

    2个月前 人工智能研究所
    77
    YingVideo-MV:巨人网络开源的音乐驱动多阶段视频生成框架

    YingVideo-MV:巨人网络开源的音乐驱动多阶段视频生成框架

    YingVideo-MV是由巨人网络开源的一款音乐驱动多阶段视频生成框架,它能够自动解析输入音频的语义特征,然后通过内置的镜头规划模块设计符合音乐氛围的画面分镜,再利用扩散...

    2个月前 人工智能研究所
    85
    AI训练中的Token是什么意思?如何计算?

    AI训练中的Token是什么意思?如何计算?

    在人工智能大模型训练领域,"Token"是理解模型处理文本机制的核心概念。作为模型可理解的最小语义单元,Token的划分方式直接影响模型的计算效率、多语言处理能力及成本结构...

    2个月前 人工智能研究所
    136
    UnityVideo:港科大 & 清华 & 快手可灵联合开源的视频理解与生成框架

    UnityVideo:港科大 & 清华 & 快手可灵联合开源的视频理解与生成框架

    UnityVideo 是由香港科技大学、香港中文大学、清华大学与快手可灵联合研发的多模态多任务统一视频理解与生成框架。该框架基于统一 Transformer 骨干网络与联合训练策略,突...

    2个月前 人工智能研究所
    72
  • 上一页
  • 2
  • 3
  • 4
  • 5
  • 6
  • 下一页

最新文章

《斩仙台》六天破亿!AI真人微短剧席卷荧屏,真人演员的“铁饭碗”还端得稳吗?

2026-03-05 AI新闻

FramePack:开源低显存AI长视频生成工具,长视频抗漂移与上下文压缩

2026-03-05 AI新闻

PISCO:稀疏控制驱动的精准视频实例插入框架,高效实现物体添加与动态编辑

2026-03-05 AI新闻

AI绘画工具哪个好?10款国内外热门AI图片生成工具深度测评与详解

2026-03-05 AI教程

Capybara:开源统一视觉创作模型,一站式支持文生图/文生视频/指令级图像视频编辑

2026-03-05 AI新闻

2026 AI编程工具深度对比:Cursor、Copilot、Claude Code、Qoder、Trae与通义灵码…谁才是效率之王?

2026-03-04 AI教程

热门工具

OpenClaw:开源本地AI智能助手,直接操控电脑,自动处理邮件与日常事务

OpenClaw

OpenClaw(原名ClawdBot和Moltbot)是一款开源、本地优先、可完全自托管的个人AI智能体(Personal AI Agent)平台。它不是一款传统意义上的聊...
飞象老师:猿辅导专为教师研发的AI教学动画与课件生成工具

飞象老师

飞象老师是猿辅导集团推出的国内首个面向中小学教师群体、专注于教学内容创作的AI专业工具平台。该平台以“赋能教师、减负增效”为核心理念,...
Hum to Search:AI哼唱识曲神器,无需下载即开即用的在线音乐识别平台

Hum to Search

Hum to Search 是一款基于AI技术的在线音乐识别工具,专为解决“旋律在脑中却不知歌名”的困扰而设计。用户只需通过浏览器打开Hum to Search官...
NiceVoice:AI驱动的在线声音克隆与个性化语音生成平台

NiceVoice

NiceVoice 是一款基于先进人工智能技术开发的在线声音克隆服务平台,通过深度学习和声纹建模技术,NiceVoice 能够仅凭用户提供的简短语音样本...
A2E AI:免费无限制AI视频生成平台,集成图像/语音/视频多模态创作工具

A2E AI

A2E AI是全球首个真正实现“免费无限制+隐私优先”的全链路AI视频创作平台,以“让每个人都能轻松制作专业级视频”为使命,整合文本、图像、语...
Z Code:智谱AI推出的轻量级AI代码编辑器,一键切换多模型编程

Z Code

Z Code 是由国内领先的人工智能公司——智谱AI推出的一款轻量级、可视化、集成式AI代码编辑器。它专为开发者设计,旨在解决当前主流AI编程工具...
© 2026 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜