准确率突破 96.33%！PaddleOCR新模型OCR综合性能全球第一-大旗号

近日，百度正式发布 PaddleOCR-VL-1.6。作为文心衍生模型，PaddleOCR-VL-1.6 在 OmniDocBench v1.6 权威评测中准确率突破 96.3%，在 Real5-OmniDocBench、OmniDocBench v1.5上也取得了最领先的分数，综合性能全球第一，刷新业界SOTA，在复杂文档理解和真实场景解析能力方面进一步突破。

在权威评测集 OmniDocBench v1.6 上，PaddleOCR-VL-1.6 总指标达到 96.33%，超越Gemini-3-Pro、GPT-5.2、MinerU-2.5-Pro、GLM-OCR等，综合性能全球第一，领跑全球通用大模型和专用OCR模型；在面向真实复杂场景构建的 Real5-OmniDocBench 评测中，PaddleOCR-VL-1.6 总指标达到 93.19%，较 Gemini-3-Pro 提升近4个百分点，在扫描件、弯折文档、屏幕拍照、光照变化及倾斜文档等五大真实场景下均保持领先表现。

测试结果显示，PaddleOCR-VL-1.6 在文本、公式、表格等核心识别能力上全面领先当前主流开源及闭源方案，在表格、古籍、生僻字识别等复杂场景能力显著提升，在印章、Spotting、图表识别等多项关键能力同步增强，可更好满足文档数字化的需求。

据了解，PaddleOCR基于文心大模型训练而来，是文心大模型多模态能力的重要部分，支持超100种语言识别，用户覆盖170多个国家和地区。此次发布的 PaddleOCR-VL-1.6 在 PaddleOCR-VL-1.5 基础上进一步升级，通过模型驱动的数据构建机制和渐进式训练优化，在保持0.9B轻量化架构的情况下，模型准确率和复杂场景适应能力进一步提升。由于两代模型模型结构一致，开发者和企业用户无需进行额外适配，即可平滑迁移。

目前，PaddleOCR-VL-1.6 已上线 PaddleOCR 官网，支持网页端和API调用。同时，模型代码及权重已同步开源至 GitHub 和 Hugging Face，面向全球开发者开放使用。

一条庆祝小红书上市失败的视频，播放量破百万！
2026-07-18

散户必看！百度双重上市：看似利好落地，隐藏的5大真实风险

文｜大力财经最近，百度正式完成港美双重主要上市的消息，刷屏了整个中概股圈。很多散户第一反应：利好！大公司兜底、估值修复、资金进场、后市要大涨！但内行都清楚：资本市场里，所有光鲜的资本操作，背后一定藏着对应的代价和风险。双重上市不是单纯的利

2026-07-18

岩山科技WAIC展现全栈AI能力，加速AI产业化落地
2026-07-17

360手机卫士入选工信部AI通信服务优秀案例

近日，工业和信息化部正式发布“2025年度信息通信服务创优典型案例”名单。由北京市通信管理局推荐、360集团申报的“AI大模型在骚扰号码和短信识别的实践应用”项目成功入选，为AI赋能通信骚扰综合治理打造了可落地、可复制的行业范本。本次典型案例征集覆盖

2026-07-17

岩山科技携五大板块亮相WAIC 2026，系统展示全栈AI能力
2026-07-17

目标价360港元！UBS瑞银首予Momenta“买入”评级
2026-07-17