DeepEyesV2:开源多模态智能体框架,融合工具链实现复杂场景可靠推理
DeepEyesV2 是一款开源的多模态智能体框架,以 Qwen-2.5-VL 系列模型为基础,核心创新在于将视觉理解、代码执行与网络搜索三大能力深度融合进单一推理循环,通过 “冷启动微...
DeepEyesV2 是一款开源的多模态智能体框架,以 Qwen-2.5-VL 系列模型为基础,核心创新在于将视觉理解、代码执行与网络搜索三大能力深度融合进单一推理循环,通过 “冷启动微...
Clueless是一款开源的AI会议助手桌面工具,主打实时转录会议内容、智能分析对话主题、自动提取行动项等功能,通过本地存储保障数据安全,支持跨会话上下文连贯分析。其基于...
AI Alignment(人工智能对齐)这一新兴交叉学科。作为AI安全领域的核心分支,对齐问题既涉及技术层面的模型训练,也涵盖伦理学、社会学、法学等多维度的价值判断。本文AI铺...
NOFX 是一个雄心勃勃的开源通用智能交易操作系统(Agentic Trading OS),旨在构建一个跨市场(当前聚焦加密货币,未来将扩展至股票、期货等)的统一交易架构。它融合了多代...
UNO-Bench是由美团LongCat团队开发的开源全模态模型评估基准,旨在系统衡量全模态模型的单模态与全模态能力。该基准涵盖44种任务类型、5种模态组合,包含1250个人工构建的全...
SAIL-Embedding是字节跳动在Hugging Face平台开源的全模态嵌入基础模型,该模型突破传统单模态嵌入的局限,可将文本、图像等多类型数据映射至统一向量空间,实现跨模态特征...
Cursor Free VIP是一款针对Cursor编辑器的开源辅助工具,专注于为用户提供更便捷的使用体验。该工具支持多种主流操作系统及硬件架构,具备配置重置、多语言切换、自动更新检...
Nano-vLLM 是一个从头构建的轻量级大模型推理框架,以仅约 1200 行 Python 代码实现了与主流推理框架相当的性能,同时保持代码的简洁性和可读性。它集成了前缀缓存、张量并...
计算机视觉(Computer Vision, CV)作为人工智能的核心领域,其技术基础建立在像素处理、卷积运算与特征提取三大支柱之上。本文AI铺子将从底层原理出发,系统解析这三个关键...
Trusted MCP是火山引擎基于标准MCP协议开发的开源可信模型上下文协议,通过身份验证、数据加密和远程证明等技术,解决AI服务组件通信中的身份伪造、数据篡改、隐私泄露等问...
