阿里国际AI翻译模型Marco霸榜WMT机器翻译大赛最难赛道-大旗号

近日，2025年国际机器翻译大赛WMT (Conference on Machine Translation) 宣布最终排名，阿里国际AI Business的翻译大模型Marco-MT-Algharb斩获6项冠军，4项亚军和2项季军。

其中，在最受关注的英中语向上，Marco-MT超越了Gemini 2.5 Pro、GPT-4.1、Claude 4和Mistral-Medium等所有顶尖闭源AI系统，登顶榜首。WMT的人工评测被视为机器翻译领域的“黄金标准”，这也标志着Marco-MT从电商行业翻译迈向通用翻译的领先行列。

作为全球机器翻译领域的顶级赛事，WMT2025吸引了Gemini 2.5 Pro、GPT-4.1、Claude 4、Mistral-Medium等主流闭源模型，以及DeepSeek-V3、Qwen3-235B、Llama-4-Maverick等领先开源模型同台竞技。

阿里国际的Marco-MT模型参加的是WMT竞赛中难度更高的受限赛道。相比于非受限赛道，受限赛道不仅要求模型能够处理文学、新闻、社交媒体等多样化内容，还需严格遵守仅使用开源数据和开源模型，且模型规模不超过20B的限制条件。

Marco-MT此次脱颖而出，关键在于将丰富的电商翻译模型训练经验与一套原创训练方法M2PO（多阶段偏好优化）相结合，成功将强化学习范式应用于大模型翻译领域。该系统分三步提升翻译质量：先通过两轮监督微调拓宽知识基础；再引入强化学习，让模型学会判断译文优劣；最后在解码阶段融合词对齐与重排序技术，在保证流畅的同时精准还原原文，显著提升翻译的准确性和忠实度。

WMT被誉为机器翻译领域的“黄金标准”，其评测结果被全球学术界与工业界视为技术风向标。本届赛事采用COMET、LLM Judge等自动指标与大规模人工评测相结合的机制，最终排名以人工评分为准。Marco-MT在包括英译中在内的13个核心语向表现优异，跻身全球顶尖水平，标志着其通用翻译能力获得广泛认可。其中，在英译中等多个语向上，表现超过人工翻译。

据「TMT星球」了解，Marco-MT发布于2024年，最初专注于电商场景翻译，已接入阿里国际旗下的电商平台，支持搜索、商品信息、对话、图片等多种场景的翻译。跨文化、多语种的业务需求，使其具备高质量、低幻觉率等核心优势，为此次向通用翻译的拓展打下坚实基础。此前，Marco-MT已在语音翻译领域崭露头角，在2025年IWSLT国际赛事中斩获2项冠军和2项亚军，表现出机器翻译领域多模态的竞争力。