AI铺子Logo
AI铺子Logo
  • 首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜

AI工具
AI软件
AI书籍
AI新闻
AI教程
排行榜
AI工具箱

AI工具箱

一个喜欢收集AI工具的小萌新

66投稿
0关注
0粉丝
0收藏
关注
  • 文章

  • 工具

  • 软件

  • 图书

    LongCat-Video:美团开源的13.6B参数多任务视频生成模型,高效输出分钟级720p长视频

    LongCat-Video:美团开源的13.6B参数多任务视频生成模型,高效输出分钟级720p长视频

    LongCat-Video是美团LongCat团队开源的基础视频生成模型,基于13.6B参数构建,采用统一架构原生支持文本转视频、图像转视频、视频续接三大任务,核心优势在于高效生成分钟级...

    1周前 AI工具箱
    13
    Archon:开源 AI 编程助手指挥中心,强化知识协作与多工具集成

    Archon:开源 AI 编程助手指挥中心,强化知识协作与多工具集成

    Archon 是一款开源的 AI 编程助手指挥中心,同时作为 Model Context Protocol(MCP)服务器,旨在通过知识管理、任务协同和多工具集成,增强 AI 编程助手(如 Claude Code、...

    1周前 AI工具箱
    5
    基于 LangChain 搭建 ReAct Agent:从原理到火车票购票任务实操指南

    基于 LangChain 搭建 ReAct Agent:从原理到火车票购票任务实操指南

    本文详解大语言模型(LLM)的四大局限性及 ReAct Agent 的核心原理,基于 LangChain 框架手把手教你搭建火车票 AI Agent,涵盖环境准备、工具定义、Prompt 设计、Agent 开发...

    1周前 AI工具箱
    8
    Skyvern:开源浏览器工作流自动化工具,基于LLM与计算机视觉实现灵活可靠的网页交互

    Skyvern:开源浏览器工作流自动化工具,基于LLM与计算机视觉实现灵活可靠的网页交互

    Skyvern是一款基于大语言模型(LLMs)和计算机视觉的开源浏览器工作流自动化工具,旨在解决传统自动化方案(如依赖XPath或DOM解析)的脆弱性问题。它通过视觉理解和逻辑推理...

    1周前 AI工具箱
    9
    DeepSeek-OCR:深度求索推出的开源 LLM 视角 OCR 工具,高效提取图像与文档文本

    DeepSeek-OCR:深度求索推出的开源 LLM 视角 OCR 工具,高效提取图像与文档文本

    DeepSeek-OCR 是由 deepseek-ai 团队开源的高性能 OCR 模型,核心聚焦于从 LLM 视角探索视觉 - 文本压缩技术,支持图像、PDF 等多模态输入的文本提取。该模型提供 Native和...

    1周前 AI工具箱
    13
    Qwen3-VL:Qwen 系列推出的强大多模态 AI 模型,打通视觉与语言的智能融合

    Qwen3-VL:Qwen 系列推出的强大多模态 AI 模型,打通视觉与语言的智能融合

    Qwen3-VL 是 Qwen 系列开源的强大多模态视觉 - 语言模型,支持图像 / 视频理解、文本交互、视觉代理等全场景任务,具备长上下文处理、空间感知、跨语言 OCR 等核心能力,提...

    1周前 AI工具箱
    18
    ChatGPT Atlas 来了!OpenAI 首款 AI 浏览器落地 macOS,跨页实时辅助 + 代理模式成亮点

    ChatGPT Atlas 来了!OpenAI 首款 AI 浏览器落地 macOS,跨页实时辅助 + 代理模式成亮点

    2025年10月21日,OpenAI正式发布ChatGPT Atlas——一款以ChatGPT为核心构建的全新网页浏览器。这款产品突破传统浏览器的功能边界,旨在将AI“超级助手”体验融入网页使用全...

    2周前 AI工具箱
    6
    零基础学AI大模型之Stream流式输出实战

    零基础学AI大模型之Stream流式输出实战

    本文将聚焦LLM的Stream流式输出,从核心原理讲起,通过“故事小助手”“科普助手”两个实战案例,带你掌握从基础调用到LCEL表达式的流式落地,最后分析流式输出的优劣势与实...

    2周前 AI工具箱
    7
    LongCat-Audio-Codec:美团开源音频编解码方案,为 Speech LLM 提供超低比特率高保真令牌生成与解码

    LongCat-Audio-Codec:美团开源音频编解码方案,为 Speech LLM 提供超低比特率高保真令牌生成与解码

    LongCat-Audio-Codec 是美团 LongCat 团队开源的音频编码(Tokenizer)与解码(Detokenizer)解决方案,专为语音大语言模型(Speech LLM)设计。该方案通过并行生成语义令牌...

    2周前 AI工具箱
    7
    nanoGPT:Karpathy 开源的极简型 GPT 开发工具,支持多硬件适配与 GPT-2 复现

    nanoGPT:Karpathy 开源的极简型 GPT 开发工具,支持多硬件适配与 GPT-2 复现

    nanoGPT是由AI研究者Andrej Karpathy开发的开源项目,基于PyTorch框架构建,定位为“最简单、最高效的中等规模GPT训练与微调仓库”。它是minGPT的重写版本,核心目标是“优...

    2周前 AI工具箱
    17
  • 上一页
  • 1
  • 2
  • 3
  • 4
  • 5
  • 下一页

最新文章

FG-CLIP:360开源的中英双语细粒度视觉-文本对齐模型,实现跨模态精准匹配与理解

2025-11-07 AI新闻

SAIL-Embedding:字节跳动推出的全模态嵌入基础模型,支持跨模态检索与通用特征表示

2025-11-07 AI新闻

提升NLP大模型性能的七大文本预处理技巧

2025-11-07 AI教程

如何高效进行模型剪枝?五大实用策略提升性能与精度平衡

2025-11-07 AI教程

MindsDB:开源 AI 驱动的数据处理服务器,支持多源数据整合与智能问答

2025-11-07 AI新闻

MaxKB:飞致云开源的企业级智能体平台,全流程RAG支持与多模态智能交互

2025-11-07 AI新闻

热门工具

造点AI:夸克推出的智能AI图片与视频生成平台

造点AI

造点AI是由阿里巴巴旗下智能搜索应用“夸克”推出的一款基于生成式人工智能(Generative AI)技术的智能内容创作平台,专注于为用户提供AI图像...
WPS灵犀:金山办公(WPS Office)推出的AI智能辅助写作与PPT生成工具

WPS灵犀

WPS灵犀是金山办公(WPS Office)旗下推出的AI智能辅助写作与PPT生成工具,依托人工智能大模型技术,专注于帮助用户高效生成PPT、文档、报告等...
魔搭社区(ModelScope):一站式AI开源模型与应用生态平台

魔搭社区(ModelScope)

魔搭社区(ModelScope)是一个一站式人工智能开源模型与应用生态平台,致力于为开发者、研究人员和企业提供模型托管、训练、推理、部署及应用搭...
豆包:字节跳动旗下一站式AI智能问答与创作助手

豆包

豆包(Doubao)是由字节跳动推出的一款多功能人工智能助手,旨在为用户提供全方位的生活、学习和工作帮助。作为字节生态中的重要AI产品之一,豆...
Roo Code:开源AI辅助编程插件,支持多模型与实时代码补全

Roo Code

Roo Code 是一款专为现代开发者打造的开源 AI 编程助手插件,旨在通过人工智能技术提升开发效率、优化代码质量,并提供实时、智能的编码辅助。...
可赞AI:可视化AI办公工具,文字秒变图表或脑图

可赞AI

可赞AI是一款集智能写作与可视化办公于一体的AI辅助工具平台,专注于通过人工智能技术帮助用户将文字内容快速转化为图表、脑图、信息图等可视...
© 2025 AI铺子(www.aipuzi.cn) 版权所有
  • 关于我们
  • 隐私政策
  • 联系我们
  • 网站地图
AI铺子
  • 网站首页
  • AI工具
  • AI软件
  • AI书籍
  • AI新闻
  • AI教程
  • 排行榜