AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
AI工具箱

AI工具箱

一个喜欢收集AI工具的小萌新

102投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    Skyvern:开源浏览器工作流自动化工具,基于LLM与计算机视觉实现灵活可靠的网页交互

    Skyvern:开源浏览器工作流自动化工具,基于LLM与计算机视觉实现灵活可靠的网页交互

    Skyvern是一款基于大语言模型(LLMs)和计算机视觉的开源浏览器工作流自动化工具,旨在解决传统自动化方案(如依赖XPath或DOM解析)的脆弱性问题。它通过视觉理解和逻辑推理...

    1个月前 AI工具箱
    18
    DeepSeek-OCR:深度求索推出的开源 LLM 视角 OCR 工具,高效提取图像与文档文本

    DeepSeek-OCR:深度求索推出的开源 LLM 视角 OCR 工具,高效提取图像与文档文本

    DeepSeek-OCR 是由 deepseek-ai 团队开源的高性能 OCR 模型,核心聚焦于从 LLM 视角探索视觉 - 文本压缩技术,支持图像、PDF 等多模态输入的文本提取。该模型提供 Native和...

    1个月前 AI工具箱
    28
    Qwen3-VL:Qwen 系列推出的强大多模态 AI 模型,打通视觉与语言的智能融合

    Qwen3-VL:Qwen 系列推出的强大多模态 AI 模型,打通视觉与语言的智能融合

    Qwen3-VL 是 Qwen 系列开源的强大多模态视觉 - 语言模型,支持图像 / 视频理解、文本交互、视觉代理等全场景任务,具备长上下文处理、空间感知、跨语言 OCR 等核心能力,提...

    1个月前 AI工具箱
    36
    ChatGPT Atlas 来了!OpenAI 首款 AI 浏览器落地 macOS,跨页实时辅助 + 代理模式成亮点

    ChatGPT Atlas 来了!OpenAI 首款 AI 浏览器落地 macOS,跨页实时辅助 + 代理模式成亮点

    2025年10月21日,OpenAI正式发布ChatGPT Atlas——一款以ChatGPT为核心构建的全新网页浏览器。这款产品突破传统浏览器的功能边界,旨在将AI“超级助手”体验融入网页使用全...

    2个月前 AI工具箱
    8
    零基础学AI大模型之Stream流式输出实战

    零基础学AI大模型之Stream流式输出实战

    本文将聚焦LLM的Stream流式输出,从核心原理讲起,通过“故事小助手”“科普助手”两个实战案例,带你掌握从基础调用到LCEL表达式的流式落地,最后分析流式输出的优劣势与实...

    2个月前 AI工具箱
    10
    LongCat-Audio-Codec:美团开源音频编解码方案,为 Speech LLM 提供超低比特率高保真令牌生成与解码

    LongCat-Audio-Codec:美团开源音频编解码方案,为 Speech LLM 提供超低比特率高保真令牌生成与解码

    LongCat-Audio-Codec 是美团 LongCat 团队开源的音频编码(Tokenizer)与解码(Detokenizer)解决方案,专为语音大语言模型(Speech LLM)设计。该方案通过并行生成语义令牌...

    2个月前 AI工具箱
    21
    nanoGPT:Karpathy 开源的极简型 GPT 开发工具,支持多硬件适配与 GPT-2 复现

    nanoGPT:Karpathy 开源的极简型 GPT 开发工具,支持多硬件适配与 GPT-2 复现

    nanoGPT是由AI研究者Andrej Karpathy开发的开源项目,基于PyTorch框架构建,定位为“最简单、最高效的中等规模GPT训练与微调仓库”。它是minGPT的重写版本,核心目标是“优...

    2个月前 AI工具箱
    33
    OpenAssistant:开源AI对话聊天系统,支持协作式数据训练与多场景交互

    OpenAssistant:开源AI对话聊天系统,支持协作式数据训练与多场景交互

    OpenAssistant 是一款开源的AI对话聊天系统,旨在通过协作模式推动高质量聊天大型语言模型(LLM)的普及。项目提供开放的聊天交互界面、协作式数据收集平台、完整的模型训练...

    2个月前 AI工具箱
    11
    MineContext:火山引擎推出的开源主动式上下文感知 AI 助手

    MineContext:火山引擎推出的开源主动式上下文感知 AI 助手

    MineContext 是火山引擎开源的主动式上下文感知 AI 助手,以 “挖掘并整合上下文” 为核心,将分散的多模态数据(文档、截图、音视频等)视为可组合的 “信息方块”,通过轻...

    2个月前 AI工具箱
    45
    多模态融合语义分割:RGB-D 数据的应用探索

    多模态融合语义分割:RGB-D 数据的应用探索

    语义分割是计算机视觉领域的核心任务,RGB-D数据(RGB图像与深度图)的融合为语义分割提供了多模态信息,通过结合颜色、纹理与几何结构,显著提升了分割精度。本文系统梳理...

    2个月前 AI工具箱
    20
  • 上一页
  • 4
  • 5
  • 6
  • 7
  • 8
  • 下一页

最新文章

A2UI:谷歌开源的一款专注于代理生成用户界面的声明式框架

2025-12-23 AI新闻

Molmo2:AllenAI开源的先进多模态语言模型,支持单图/多图/视频输入与深度语义理解

2025-12-23 AI新闻

MiMo-V2-Flash:小米开源的千亿级混合专家语言模型,高速推理与长上下文处理兼备

2025-12-23 AI新闻

LongCat-Video-Avatar:美团开源的多任务音频驱动动画生成模型

2025-12-23 AI新闻

SAM-Audio:Meta 研究院推出的开源多模态音频分离基础模型

2025-12-22 AI新闻

TRELLIS.2:微软开源的高保真图像到 3D 生成模型

2025-12-22 AI新闻

热门工具

飞象老师:猿辅导专为教师研发的AI教学动画与课件生成工具

飞象老师

飞象老师是猿辅导集团推出的国内首个面向中小学教师群体、专注于教学内容创作的AI专业工具平台。该平台以“赋能教师、减负增效”为核心理念,...
Hum to Search:AI哼唱识曲神器,无需下载即开即用的在线音乐识别平台

Hum to Search

Hum to Search 是一款基于AI技术的在线音乐识别工具,专为解决“旋律在脑中却不知歌名”的困扰而设计。用户只需通过浏览器打开Hum to Search官...
WPS灵犀:金山办公(WPS Office)推出的AI智能辅助写作与PPT生成工具

WPS灵犀

WPS灵犀是金山办公(WPS Office)旗下推出的AI智能辅助写作与PPT生成工具,依托人工智能大模型技术,专注于帮助用户高效生成PPT、文档、报告等...
ZenMux:高性价比AI API 网关平台,支持多个大模型调用与智能容灾

ZenMux

ZenMux 是一个面向开发者与企业的生成式人工智能(GenAI)API 网关平台,它聚合了全球顶级大模型(如 Qwen3-Max、MetaGPT 等)的“超级接入层...
文优小助:AI驱动的学术写作智能助手,一键生成文献综述、开题报告与论文初稿

文优小助

文优小助是一款专注于学术场景的人工智能写作助手,定位于高校学生、科研人员及教育工作者,旨在降低学术写作门槛,提高内容产出效率。它不是...
灵光网页版:蚂蚁集团推出的全模态通用AI助手和闪应用生成平台

灵光网页版

灵光网页版是蚂蚁集团旗下全新推出的全模态通用人工智能助手,该产品依托蚂蚁在AI大模型和自然语言处理领域的深厚积累,支持通过自然语言快速...
© 2025 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜