大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

阿里国际AI翻译模型Marco霸榜WMT机器翻译大赛最难赛道

TMT星球 2025-10-24

近日,2025年国际机器翻译大赛WMT (Conference on Machine Translation) 宣布最终排名,阿里国际AI Business的翻译大模型Marco-MT-Algharb斩获6项冠军,4项亚军和2项季军。

其中,在最受关注的英中语向上,Marco-MT超越了Gemini 2.5 Pro、GPT-4.1、Claude 4和Mistral-Medium等所有顶尖闭源AI系统,登顶榜首。WMT的人工评测被视为机器翻译领域的“黄金标准”,这也标志着Marco-MT从电商行业翻译迈向通用翻译的领先行列。

作为全球机器翻译领域的顶级赛事,WMT2025吸引了Gemini 2.5 Pro、GPT-4.1、Claude 4、Mistral-Medium等主流闭源模型,以及DeepSeek-V3、Qwen3-235B、Llama-4-Maverick等领先开源模型同台竞技。

阿里国际的Marco-MT模型参加的是WMT竞赛中难度更高的受限赛道。相比于非受限赛道,受限赛道不仅要求模型能够处理文学、新闻、社交媒体等多样化内容,还需严格遵守仅使用开源数据和开源模型,且模型规模不超过20B的限制条件。

Marco-MT此次脱颖而出,关键在于将丰富的电商翻译模型训练经验与一套原创训练方法M2PO(多阶段偏好优化)相结合,成功将强化学习范式应用于大模型翻译领域。该系统分三步提升翻译质量:先通过两轮监督微调拓宽知识基础;再引入强化学习,让模型学会判断译文优劣;最后在解码阶段融合词对齐与重排序技术,在保证流畅的同时精准还原原文,显著提升翻译的准确性和忠实度。

WMT被誉为机器翻译领域的“黄金标准”,其评测结果被全球学术界与工业界视为技术风向标。本届赛事采用COMET、LLM Judge等自动指标与大规模人工评测相结合的机制,最终排名以人工评分为准。Marco-MT在包括英译中在内的13个核心语向表现优异,跻身全球顶尖水平,标志着其通用翻译能力获得广泛认可。其中,在英译中等多个语向上,表现超过人工翻译。

据「TMT星球」了解,Marco-MT发布于2024年,最初专注于电商场景翻译,已接入阿里国际旗下的电商平台,支持搜索、商品信息、对话、图片等多种场景的翻译。跨文化、多语种的业务需求,使其具备高质量、低幻觉率等核心优势,为此次向通用翻译的拓展打下坚实基础。此前,Marco-MT已在语音翻译领域崭露头角,在2025年IWSLT国际赛事中斩获2项冠军和2项亚军,表现出机器翻译领域多模态的竞争力。

抖音电商专项治理玉石翡翠虚假宣传,日均拦截违规商品5万件
10月23日,抖音电商安全与信任中心发布治理玉石翡翠虚假宣传的公告,今年以来该平台共处置违规达人1.26万人,日均拦截违规商品5万件。虚假营销长期存在于珠宝玉石领域。由于玉石鉴定专业门槛较高,普通消费者难以凭肉眼或日常经验判断材质及处理工艺。该平台

2025-10-23

夸克上线AI对话助手,堪称 “百度 + 豆包” 综合体
10月23日,阿里巴巴旗下AI旗舰应用夸克正式上线了对话助手,这场被猜了许久的阿里夸克“C计划”终于揭开面纱。此前关于“C计划”的猜测众说纷纭,既有解读“C”代表“Chat”,意味着夸克可能将推出全新的对话交互形态,也有观点认为“C”取自经典游戏“吃豆人

2025-10-23

把AI装进OS、批量落地智慧服务,智能手机革命2.0来了
文 | 智能相对论作者 | 守一智能手机行业常常被认为已经陷入“内卷”旋涡中:头部厂商每年都会大力宣传产品在功能上的升级与革新,但消费者因软硬件性能提升而更换手机的意愿却日益降低。如今,手机用户对自身“苹果用户”或“安卓用户”的身份标识不再过分关

2025-10-22

IDC:中国AI基础设施市场爆发式增长,阿里云第一
10月22日,国际数据机构IDC最新报告《中国智算云基础设施市场(AI IaaS)(2025上半年)跟踪》显示,2025年上半年,中国AI基础设施服务市场同比增长122.4%,达到198.7亿。其中,阿里云占比24.7%稳居第一,并在GenAI IaaS(生成式AI基础设施)和Other AI IaaS

2025-10-22