肉包(Roubao):无需电脑的开源AI手机自动化助手,自然语言操控全场景任务
肉包(Roubao)是一款开源的Android AI手机自动化助手,基于Kotlin原生编写,依托视觉语言模型与多Agent协作架构,无需电脑、ADB与Python环境,用户通过自然语言指令即可让...
肉包(Roubao)是一款开源的Android AI手机自动化助手,基于Kotlin原生编写,依托视觉语言模型与多Agent协作架构,无需电脑、ADB与Python环境,用户通过自然语言指令即可让...
详解 llama.cpp 架构原理、GGUF 模型格式、Q4_K_M 量化策略、CPU/GPU 部署实战、API 服务配置及 2025 新增路由模式。涵盖树莓派/Mac/Windows/Linux 全平台,附故障排查与性...
Helios是北京大学YuanGroup开源的140亿参数实时长视频生成模型,无需传统抗漂移与加速技巧,即可在单张H100显卡实现19.5FPS端到端推理,支持文本/图像/视频驱动的分钟级高质...
Zerox是一款面向AI数据摄入场景的开源光学字符识别工具,核心定位是用极简方式把各类视觉形态的文档,转换成AI可直接处理的结构化Markdown格式。它由getomni-ai团队开发并维...
近日,在美国头部营养追踪应用MyFitnessPal宣布完成对AI卡路里计算应用Cal AI的收购仅两天后,一笔高达3000万美元(约合人民币2亿元)的年收入数据震惊了科技圈。这不仅是一...
ImageCritic是由南开大学HVision实验室推出的开源AI图像后处理项目,基于参考引导的注意力对齐机制,专门解决扩散模型生成图像中常见的细节错位、纹理不匹配、结构不一致等...
LocoOperator-4B是LocoreMind团队开源的一款专用代码探索子代理模型,属于轻量级代码智能体(Code Agent),它以Qwen3-4B-Instruct-2507为基座,通过知识蒸馏方式学习Qwen3...
OpenFang是RightNow-AI团队开发的开源、生产级智能体操作系统(Agent Operating System),它并非传统聊天机器人框架、Python封装的大模型调用工具,也不是简单的多智能体编...
2026年2月27日凌晨,谷歌在没有任何预热发布会的情况下,于Gemini平台悄然上线了新一代图像生成模型Nano Banana 2(官方代号Gemini 3.1 Flash Image)。这一被称为“深水炸...
InstantID是由InstantX团队联合小红书、北京大学开源的零样本、免微调、单图驱动的身份保留生成模型,基于Stable Diffusion XL与自研IdentityNet、解耦交叉注意力适配器实现...
