大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

准确率突破 96.33%!PaddleOCR新模型OCR综合性能全球第一

商业范儿 2026-06-02

近日,百度正式发布 PaddleOCR-VL-1.6。作为文心衍生模型,PaddleOCR-VL-1.6 在 OmniDocBench v1.6 权威评测中准确率突破 96.3%,在 Real5-OmniDocBench、OmniDocBench v1.5上也取得了最领先的分数,综合性能全球第一,刷新业界SOTA,在复杂文档理解和真实场景解析能力方面进一步突破。

在权威评测集 OmniDocBench v1.6 上,PaddleOCR-VL-1.6 总指标达到 96.33%,超越Gemini-3-Pro、GPT-5.2、MinerU-2.5-Pro、GLM-OCR等,综合性能全球第一,领跑全球通用大模型和专用OCR模型;在面向真实复杂场景构建的 Real5-OmniDocBench 评测中,PaddleOCR-VL-1.6 总指标达到 93.19%,较 Gemini-3-Pro 提升近4个百分点,在扫描件、弯折文档、屏幕拍照、光照变化及倾斜文档等五大真实场景下均保持领先表现。

测试结果显示,PaddleOCR-VL-1.6 在文本、公式、表格等核心识别能力上全面领先当前主流开源及闭源方案,在表格、古籍、生僻字识别等复杂场景能力显著提升,在印章、Spotting、图表识别等多项关键能力同步增强,可更好满足文档数字化的需求。

据了解,PaddleOCR基于文心大模型训练而来,是文心大模型多模态能力的重要部分,支持超100种语言识别,用户覆盖170多个国家和地区。此次发布的 PaddleOCR-VL-1.6 在 PaddleOCR-VL-1.5 基础上进一步升级,通过模型驱动的数据构建机制和渐进式训练优化,在保持0.9B轻量化架构的情况下,模型准确率和复杂场景适应能力进一步提升。由于两代模型模型结构一致,开发者和企业用户无需进行额外适配,即可平滑迁移。

目前,PaddleOCR-VL-1.6 已上线 PaddleOCR 官网,支持网页端和API调用。同时,模型代码及权重已同步开源至 GitHub 和 Hugging Face,面向全球开发者开放使用。

VLA不会死,但不融合世界模型的除外
数据工厂的沉默战争,决定谁能笑到最后

2026-06-01

从首发4nm智驾芯片到兜底城市领航安全,比亚迪开启AI新征程
在AI技术的驱动下,汽车正在从单纯的出行工具加速进化为能主动思考的智能生命体。但对于普通消费者而言,即便是拥有带智驾功能的车辆,仍有约70%的用户不常用、甚至不敢用。为了让好技术人人可享、人人放心享,日前,比亚迪率先承诺为城市领航安全兜底1年。也

2026-06-01

中端机卷到极致,vivo S60 另起一局
vivo S60 重新读懂年轻人

2026-05-30

交大医学院携手华为:解锁光智共融,AI F5G-A如何重塑数智校园?
周浦镇位于上海市浦东新区西部、黄浦江东岸,既有“浦东第一镇”“小上海”的美誉,也是被称为“医谷”的上海国际医学园区所在地。2025年9月,上海交通大学医学院(以下称“交大医学院”)浦东校区的正式启用,不仅为“医谷”补上了医学教育的关键拼图,更开

2026-05-29

Agent还没来,昇腾已经把从硬件到软件的路铺好了
昇腾,打响了一场Agent前夜的“硬软合围战”

2026-05-29