AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
AI工具箱

AI工具箱

一个喜欢收集AI工具的小萌新

222投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    ebook2audiobook:开源电子书转有声书工具,支持 1110 + 语言与多模型语音克隆

    ebook2audiobook:开源电子书转有声书工具,支持 1110 + 语言与多模型语音克隆

    ebook2audiobook是一款开源的电子书转有声书工具,核心功能是将非DRM合法电子书转换为带章节结构与元数据的有声书。工具支持1110+种语言,集成XTTSv2、Bark、Vits等主流TTS...

    7个月前 AI工具箱
    162
    RAG三大组件详解:检索器、重排序器与生成器

    RAG三大组件详解:检索器、重排序器与生成器

    在AI技术深度渗透的今天,检索增强生成(RAG)已成为突破大模型知识局限的核心技术。通过将外部知识库与生成模型深度融合,RAG有效解决了传统大模型在时效性、准确性和专业...

    7个月前 AI工具箱
    219
    OmniVinci:NVIDIA开源的全模态理解大语言模型,高效融合视觉、音频与文本信息

    OmniVinci:NVIDIA开源的全模态理解大语言模型,高效融合视觉、音频与文本信息

    OmniVinci是由NVIDIA等机构开发的开源全模态理解大语言模型(Omni-Modal Understanding LLM),旨在通过创新架构与高效数据构建,实现对视觉(图像、视频)、音频、文本信息...

    7个月前 AI工具箱
    116
    OpenMemory:开源自托管AI记忆引擎,基于分层架构实现LLM持久化语义记忆

    OpenMemory:开源自托管AI记忆引擎,基于分层架构实现LLM持久化语义记忆

    OpenMemory是一款开源、自托管、框架无关的AI记忆引擎,旨在为大型语言模型(LLM)应用提供持久化、结构化和语义化的记忆能力。它通过独特的分层记忆分解(HMD v2)架构,解...

    7个月前 AI工具箱
    193
    LongCat-Video:美团开源的13.6B参数多任务视频生成模型,高效输出分钟级720p长视频

    LongCat-Video:美团开源的13.6B参数多任务视频生成模型,高效输出分钟级720p长视频

    LongCat-Video是美团LongCat团队开源的基础视频生成模型,基于13.6B参数构建,采用统一架构原生支持文本转视频、图像转视频、视频续接三大任务,核心优势在于高效生成分钟级...

    7个月前 AI工具箱
    229
    Archon:开源 AI 编程助手指挥中心,强化知识协作与多工具集成

    Archon:开源 AI 编程助手指挥中心,强化知识协作与多工具集成

    Archon 是一款开源的 AI 编程助手指挥中心,同时作为 Model Context Protocol(MCP)服务器,旨在通过知识管理、任务协同和多工具集成,增强 AI 编程助手(如 Claude Code、...

    7个月前 AI工具箱
    103
    基于 LangChain 搭建 ReAct Agent:从原理到火车票购票任务实操指南

    基于 LangChain 搭建 ReAct Agent:从原理到火车票购票任务实操指南

    本文详解大语言模型(LLM)的四大局限性及 ReAct Agent 的核心原理,基于 LangChain 框架手把手教你搭建火车票 AI Agent,涵盖环境准备、工具定义、Prompt 设计、Agent 开发...

    8个月前 AI工具箱
    100
    Skyvern:开源浏览器工作流自动化工具,基于LLM与计算机视觉实现灵活可靠的网页交互

    Skyvern:开源浏览器工作流自动化工具,基于LLM与计算机视觉实现灵活可靠的网页交互

    Skyvern是一款基于大语言模型(LLMs)和计算机视觉的开源浏览器工作流自动化工具,旨在解决传统自动化方案(如依赖XPath或DOM解析)的脆弱性问题。它通过视觉理解和逻辑推理...

    8个月前 AI工具箱
    104
    DeepSeek-OCR:深度求索推出的开源 LLM 视角 OCR 工具,高效提取图像与文档文本

    DeepSeek-OCR:深度求索推出的开源 LLM 视角 OCR 工具,高效提取图像与文档文本

    DeepSeek-OCR 是由 deepseek-ai 团队开源的高性能 OCR 模型,核心聚焦于从 LLM 视角探索视觉 - 文本压缩技术,支持图像、PDF 等多模态输入的文本提取。该模型提供 Native和...

    8个月前 AI工具箱
    152
    Qwen3-VL:Qwen 系列推出的强大多模态 AI 模型,打通视觉与语言的智能融合

    Qwen3-VL:Qwen 系列推出的强大多模态 AI 模型,打通视觉与语言的智能融合

    Qwen3-VL 是 Qwen 系列开源的强大多模态视觉 - 语言模型,支持图像 / 视频理解、文本交互、视觉代理等全场景任务,具备长上下文处理、空间感知、跨语言 OCR 等核心能力,提...

    8个月前 AI工具箱
    131
  • 上一页
  • 15
  • 16
  • 17
  • 18
  • 19
  • 下一页

最新文章

CADAM:开源浏览器AI文生参数化CAD工具,一键生成可编辑机械3D模型

2026-06-22 AI新闻

Qwen-Robot Suite:阿里千问开源具身机器人模型套件,一体化实现操作导航与物理推演

2026-06-22 AI新闻

Grok Imagine Video 1.5:马斯克xAI推出的音画同步图生视频模型

2026-06-22 AI新闻

Claude Fable 5:Anthropic推出的Mythos级旗舰大模型,百万上下文与顶尖代码推理能力

2026-06-22 AI新闻

LOGOS:阿里开源统一科学生成框架,单模型覆盖化学生物材料全领域AI设计

2026-06-22 AI新闻

MMAE:开源大规模多任务音频编辑评测基准,自动化量化AI音频模型综合性能

2026-06-20 AI新闻

热门工具

万镜一刻:阿里云打造的AI视频创作平台,实现从剧本到成片的全流程覆盖

万镜一刻

万镜一刻是阿里云正在内测的一款AI视频创作工具,其核心定位是为不同需求的创作者提供从内容解析到故事板生成,乃至最终成片的一站式解决方案...
AnyToCopy:支持150+平台的AI智能视频文案提取与去水印工具

AnyToCopy

AnyToCopy是一款基于人工智能技术驱动的多功能在线内容提取工具,专注于为用户提供跨平台视频、图片内容解析服务。致力于解决用户在短视频时代...
TransPocket:AI驱动的智能语音转文字与翻译平台

TransPocket

TransPocket 是一款基于先进人工智能技术打造的在线音频视频转文字服务工具,致力于为用户提供高效、精准、安全的语音内容数字化解决方案。依...
OpenClaw:开源本地AI智能助手,直接操控电脑,自动处理邮件与日常事务

OpenClaw

OpenClaw(原名ClawdBot和Moltbot)是一款开源、本地优先、可完全自托管的个人AI智能体(Personal AI Agent)平台。它不是一款传统意义上的聊...
飞象老师:猿辅导专为教师研发的AI教学动画与课件生成工具

飞象老师

飞象老师是猿辅导集团推出的国内首个面向中小学教师群体、专注于教学内容创作的AI专业工具平台。该平台以“赋能教师、减负增效”为核心理念,...
遨虾:1688推出的AI跨境电商Agent,自动选爆品、秒出商品图,助力卖家高效出海

遨虾

遨虾是1688平台专为跨境电商打造的AI智能体(Agent),整合了AI选品、AI找商、AI素材生成、AI询盘处理四大核心模块,覆盖跨境贸易从“发现机会”...
© 2026 AI铺子(www.aipuzi.cn) 版权所有 蜀ICP备09118534号
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜