Qianfan-OCR:百度千帆开源的端到端文档智能模型,一站式实现OCR、版面分析与文档理解 Qianfan-OCR是百度千帆团队研发的4B参数端到端统一文档智能模型,基于视觉语言架构,将文档解析、版面分析、文档理解融为一体,支持图像直接转Markdown/JSON/HTML,覆盖OCR... 1个月前 AI新闻 159
MinerU:开源多模态文档解析工具,高效提取 PDF 中表格、公式与复杂布局内容 MinerU 是由 OpenDataLab 开发的开源多模态大模型工具,专注于解决 PDF 等复杂文档的内容提取难题。它通过创新的两阶段推理架构和原生高分辨率处理能力,在布局分析、表格识... 6个月前 AI新闻 506