LLaVA-OneVision-1.5:EvolvingLMMs-Lab 推出的全流程多模态模型开发工具链
LLaVA-OneVision-1.5 是由 EvolvingLMMs-Lab 开发的全开源多模态模型框架,专注于通过原生分辨率图像训练实现高性能、低成本的大型多模态模型(LMMs)。该项目提供从数据处...
LLaVA-OneVision-1.5 是由 EvolvingLMMs-Lab 开发的全开源多模态模型框架,专注于通过原生分辨率图像训练实现高性能、低成本的大型多模态模型(LMMs)。该项目提供从数据处...
10 月 16 日,人工智能领域迎来新动态,知名人工智能公司 Anthropic 在其官网正式发布了新款小型 AI 模型 Claude Haiku4.5。这款模型凭借独特优势,一经推出便备受瞩目。...
据The Information报道,全球估值最高的AI编码助手公司Anysphere正与Coatue、Accel等顶级投资机构洽谈新一轮融资,融资规模至少10亿美元,融资前估值已飙升至270亿美元。这...
近日,蚂蚁集团正式开源了业内首个高性能扩散语言模型推理框架 ——dInfer。这一框架的推出,不仅意味着扩散语言模型在推理速度上取得了重大突破,也标志着这一新兴技术向实...
OpenCoder 是一个开源的 AI 编程助手,旨在为开发者提供智能编程辅助。它最初是作为 Claude Code 的开源替代方案而创建,提供了相似的用户界面和用户体验,但具有更高的灵活...
BabelDOC是一款开源的PDF科学论文翻译与双语对比工具,它并非普通的文档翻译工具,而是聚焦学术场景的“专业级解决方案”——针对PDF科学论文中常见的公式、表格、跨页段落...
在人工智能领域,AI代理(AI Agent)的自主决策能力已成为衡量系统智能水平的核心指标。传统语言模型依赖静态上下文窗口,难以应对动态环境中的复杂任务需求。Agentic Cont...
