Depth Anything 3:字节跳动开源的全场景任意视图3D几何重建模型
Depth Anything 3是字节跳动Seed团队开源的3D视觉基础模型,旨在从任意数量、任意视角的视觉输入中恢复空间一致的三维几何结构。该模型采用“单Transformer主干+Depth-Ray统...
Depth Anything 3是字节跳动Seed团队开源的3D视觉基础模型,旨在从任意数量、任意视角的视觉输入中恢复空间一致的三维几何结构。该模型采用“单Transformer主干+Depth-Ray统...
Local Dream是一个专注于Android平台的开源AI图像生成项目,核心目标是让用户在移动设备上无需依赖云端算力,即可本地运行Stable Diffusion模型完成各类图像创作。区别于需...
Cognee是一个面向AI代理(AI Agents)设计的开源内存工具与平台,从本质来看,Cognee并非简单的数据存储工具,而是一套完整的“数据结构化-知识关联-智能检索”解决方案:它...
据最新消息,Amazon近日在公司内部新闻平台发布备忘录,明确建议工程师在编程工作中优先使用其自主研发的AI工具Kiro,而非第三方AI编程服务。这一举措已获Amazon发言人证实...
KTransformers是一款基于CPU-GPU异构计算的开源框架,专注于大型语言模型(LLM)的高效推理与微调优化。项目核心包含kt-kernel(高性能推理内核)和kt-sft(轻量化微调框架...
Claude Opus 4.5是Anthropic推出的最新一代旗舰AI模型,于2025年11月25日正式发布。它以“智能、高效、安全”为核心特质,在编程、智能体运作、计算机工具使用三大领域确立...
Fara-7B是微软开源的首款专注于计算机使用的代理型轻量语言模型(SLM),仅70亿参数却实现了同类领先的Web任务自动化能力。该模型基于Qwen2.5-VL-7B训练,通过视觉感知网页...
近日,字节跳动旗下AI编程工具TRAE宣布其核心创新功能SOLO模式正式登陆中国版平台,即日起对所有用户全量开放且完全免费使用。这一战略升级标志着TRAE从传统“代码生成”工...
HunyuanOCR是腾讯混元开源的端到端OCR专家模型,基于混元原生多模态架构构建,仅1B参数便实现了业界多项SOTA性能。该工具覆盖文字检测识别、复杂文档解析、开放字段信息抽取...
Ruyi是Ruyi-Models项目的核心图像到视频(Image-to-Video, i2v)生成模型,由CreateAI团队开发并开源,旨在为用户提供“低门槛、高性能、高自由度”的视频生成解决方案。不...