大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

阿里国际AI翻译模型Marco霸榜WMT机器翻译大赛最难赛道

TMT星球 2025-10-24

近日,2025年国际机器翻译大赛WMT (Conference on Machine Translation) 宣布最终排名,阿里国际AI Business的翻译大模型Marco-MT-Algharb斩获6项冠军,4项亚军和2项季军。

其中,在最受关注的英中语向上,Marco-MT超越了Gemini 2.5 Pro、GPT-4.1、Claude 4和Mistral-Medium等所有顶尖闭源AI系统,登顶榜首。WMT的人工评测被视为机器翻译领域的“黄金标准”,这也标志着Marco-MT从电商行业翻译迈向通用翻译的领先行列。

作为全球机器翻译领域的顶级赛事,WMT2025吸引了Gemini 2.5 Pro、GPT-4.1、Claude 4、Mistral-Medium等主流闭源模型,以及DeepSeek-V3、Qwen3-235B、Llama-4-Maverick等领先开源模型同台竞技。

阿里国际的Marco-MT模型参加的是WMT竞赛中难度更高的受限赛道。相比于非受限赛道,受限赛道不仅要求模型能够处理文学、新闻、社交媒体等多样化内容,还需严格遵守仅使用开源数据和开源模型,且模型规模不超过20B的限制条件。

Marco-MT此次脱颖而出,关键在于将丰富的电商翻译模型训练经验与一套原创训练方法M2PO(多阶段偏好优化)相结合,成功将强化学习范式应用于大模型翻译领域。该系统分三步提升翻译质量:先通过两轮监督微调拓宽知识基础;再引入强化学习,让模型学会判断译文优劣;最后在解码阶段融合词对齐与重排序技术,在保证流畅的同时精准还原原文,显著提升翻译的准确性和忠实度。

WMT被誉为机器翻译领域的“黄金标准”,其评测结果被全球学术界与工业界视为技术风向标。本届赛事采用COMET、LLM Judge等自动指标与大规模人工评测相结合的机制,最终排名以人工评分为准。Marco-MT在包括英译中在内的13个核心语向表现优异,跻身全球顶尖水平,标志着其通用翻译能力获得广泛认可。其中,在英译中等多个语向上,表现超过人工翻译。

据「TMT星球」了解,Marco-MT发布于2024年,最初专注于电商场景翻译,已接入阿里国际旗下的电商平台,支持搜索、商品信息、对话、图片等多种场景的翻译。跨文化、多语种的业务需求,使其具备高质量、低幻觉率等核心优势,为此次向通用翻译的拓展打下坚实基础。此前,Marco-MT已在语音翻译领域崭露头角,在2025年IWSLT国际赛事中斩获2项冠军和2项亚军,表现出机器翻译领域多模态的竞争力。

百度重组AI,成立数字人创新业务部
近日,据媒体报道,百度MEG业务板块迎来新一轮组织架构调整。本次调整将商业部与电商事业部合并,组建大商业事业部,同时原数字人创新业务部升级为独立部门。早在5月13日举办的Create2026百度AI开发者大会上,百度就对数字人业务进行重点布局。旗下数字人品牌

2026-06-08

“你打你的,我打我的”,华为云在国计民生里找到了真正的牌桌
在国计民生这条路上,AI如何跑得更远?华为云给出了答案

2026-06-06

登顶全球!追觅扫地机斩获全球销量销额双第一
6 月 4 日,国际数据公司 IDC 正式发布《全球家用智能扫地机器人市场季度跟踪报告》,2026 年第一季度,追觅扫地机强势拿下全球销量与销额双第一。自诞生之初,追觅扫地机便锚定“生而全球化”的战略,自 2023 年 5 月至今,追觅扫地机已在全球 120 个国家和

2026-06-05

杭州家装深度解码:跳出“哪家好”的陷阱,建立你的价值坐标系
2026年,杭州家装市场正经历一场静默的范式转移。杭州市建筑装饰行业协会数据显示,本地住宅装修投诉中,“效果图与实景不符”“增项纠纷”“交付后环保不达标”三类问题占比超六成。与此同时,一项关于“新一代住宅需求”的消费者调研显示,87.3%的杭州购房

2026-06-05