大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

OpenDataLab将与钉钉打造免费全能的文档解析神器

TMT星球 2025-09-04

高质量数据是AI大模型训练与应用的基础,更是企业向AI转型升级的 “燃料”。然而,众多企业在开发AI应用过程中,却因大模型难以读懂非结构化数据而面临困境。

能否让更多企业级用户用上一款更趁手的数据工具,从而实现AI-Ready数据自由?

近日,OpenDataLab和钉钉正基于MinerU,推出一款面向企业用户的文档解析工具——DLU(document Language Understanding),共同助力企业破解AI-Ready数据难题,从而降低行业大模型训练及AI应用开发门槛,加速AI技术在各行业的规模化落地。

MinerU是上海人工智能实验室(上海AI实验室)OpenDataLab推出的智能文档解析引擎,因精准解析能力及广泛兼容性深受用户青睐,在GitHub上已累计获得超4万星标。

上海AI实验室作为国际级人工智能新型科研机构,在大模型、数据智能等方向具备深厚的技术积累。其自主研发的OpenDataLab平台为国内领先的人工智能大模型数据平台,拥有7700余个开源精标数据集,迄今已为超10万用户提供了200余万次数据获取服务。近期更新的MinerU2.0实现了解析速度和精度双提升,甚至以0.98B的参数达成性能比肩72B的主流大模型。

作为阿里巴巴集团旗下的企业级智能移动办公平台,钉钉拥有丰富的文档产品和广阔的企业用户基础。钉钉文档、AI表格等产品此前已深度集成MinerU能力,并通过开放平台向生态开发者开放文档解析功能,为DLU的联合研发提供了扎实的技术与场景基础。

基于MinerU打造的DLU将于近期开源,其具备良好的文件格式兼容性,深层次的内容理解与精准的结构化输出能力。DLU不仅支持主流的Office文档、PDF、Markdown及代码文件,还涵盖钉钉自有的文档、表格与AI表格格式;并支持提取纯文本内容,精准解析图表、公式、插图乃至专业领域的化学分子式等复杂视觉元素,将其有效转换为适合大模型训练的高质量语料。

接下来,DLU还将借助钉钉在企业服务场景上优势,深度融入办公协同生态,支持用户在同一平台内完成从文档创建、解析提取、知识库管理、数据标注到定制化模型训练的全流程闭环,提升AI应用开发与日常办公效率。

上海人工智能实验室青年科学家、OpenDataLab/MinerU开源项目创始人何聪辉表示:“MinerU拥有广泛的用户基础,我们希望进一步拓展其在企业场景中的应用,并充分发挥OpenDataLab平台的作用,与合作伙伴共同打造‘数据工具中的PyTorch’,助力更多企业级用户实现AI-Ready数据的自由。”

钉钉CTO朱鸿表示:“开源DLU,能有效解决企业在AI时代面临的数据准备难题,筑牢智能化转型根基。钉钉正积极构建AI新生态,期待携手更多技术伙伴与行业力量,共同为千行百业的数字化转型与智能化升级提供强劲支撑”。

直播+短视频+AIGC全面加持 京东“新域倍增计划”将帮助10万新商家销售翻番
4月14日,2026京东商家内容大会在北京举办。会上,京东正式发布“新域倍增计划”,聚焦直播和短视频领域,从流量扶持、降本增收、智能提效、生态护航4大维度着手,推出12项扶持举措,全面助力商家健康增长,目标在2026年通过直播和短视频帮助10万新商家销售同

2026-04-15

剽窃“真铜实料”概念,海信高管回应格力喊话:又当又立
文丨大力财经4月14日晚,格力电器CMO朱磊突然在微博开炮,直指海信空调在上海家博会上“公然剽窃”格力原创的“真铜实料”宣传语,措辞犀利地怒批:“这四个字是格力的原创,更是一套坚硬的品质标准,当产品还有电机绕组用铝线时,没资格自称真铜实料”,暗指

2026-04-15

赋予机器智慧之眼 AI视觉机器人NAVO惊艳亮相广交会
2026年4月15日,第 139 届中国进出口商品交易会(即 2026 春季广交会)在广州盛大开幕,作为中国外贸的 “晴雨表” 与 “风向标”,本届展会吸引了全球各地的品牌与客商齐聚,共探全球贸易的新机遇。此次,追觅科技旗下 AI 视觉机器人品牌NAVO,携全系列高端A

2026-04-15

让“养虾”有手就行,荣耀YOYO Claw节省的不只是50%词元消耗
文 | 智能相对论作者 | 佘凯文2026年初,以Open Claw为代表的“龙虾”类AI智能体一夜爆火,被业界誉为“AI智能体的操作系统”。然而短短数月,一股无声的“弃养潮”开始在用户中蔓延,不是技术退步了,而是大量个人用户乃至中小企业发现,这只虾真的“养不起

2026-04-15