大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

阿里国际AI翻译模型Marco霸榜WMT机器翻译大赛最难赛道

TMT星球 2025-10-24

近日,2025年国际机器翻译大赛WMT (Conference on Machine Translation) 宣布最终排名,阿里国际AI Business的翻译大模型Marco-MT-Algharb斩获6项冠军,4项亚军和2项季军。

其中,在最受关注的英中语向上,Marco-MT超越了Gemini 2.5 Pro、GPT-4.1、Claude 4和Mistral-Medium等所有顶尖闭源AI系统,登顶榜首。WMT的人工评测被视为机器翻译领域的“黄金标准”,这也标志着Marco-MT从电商行业翻译迈向通用翻译的领先行列。

作为全球机器翻译领域的顶级赛事,WMT2025吸引了Gemini 2.5 Pro、GPT-4.1、Claude 4、Mistral-Medium等主流闭源模型,以及DeepSeek-V3、Qwen3-235B、Llama-4-Maverick等领先开源模型同台竞技。

阿里国际的Marco-MT模型参加的是WMT竞赛中难度更高的受限赛道。相比于非受限赛道,受限赛道不仅要求模型能够处理文学、新闻、社交媒体等多样化内容,还需严格遵守仅使用开源数据和开源模型,且模型规模不超过20B的限制条件。

Marco-MT此次脱颖而出,关键在于将丰富的电商翻译模型训练经验与一套原创训练方法M2PO(多阶段偏好优化)相结合,成功将强化学习范式应用于大模型翻译领域。该系统分三步提升翻译质量:先通过两轮监督微调拓宽知识基础;再引入强化学习,让模型学会判断译文优劣;最后在解码阶段融合词对齐与重排序技术,在保证流畅的同时精准还原原文,显著提升翻译的准确性和忠实度。

WMT被誉为机器翻译领域的“黄金标准”,其评测结果被全球学术界与工业界视为技术风向标。本届赛事采用COMET、LLM Judge等自动指标与大规模人工评测相结合的机制,最终排名以人工评分为准。Marco-MT在包括英译中在内的13个核心语向表现优异,跻身全球顶尖水平,标志着其通用翻译能力获得广泛认可。其中,在英译中等多个语向上,表现超过人工翻译。

据「TMT星球」了解,Marco-MT发布于2024年,最初专注于电商场景翻译,已接入阿里国际旗下的电商平台,支持搜索、商品信息、对话、图片等多种场景的翻译。跨文化、多语种的业务需求,使其具备高质量、低幻觉率等核心优势,为此次向通用翻译的拓展打下坚实基础。此前,Marco-MT已在语音翻译领域崭露头角,在2025年IWSLT国际赛事中斩获2项冠军和2项亚军,表现出机器翻译领域多模态的竞争力。

百度APP:分5亿现金、2026北京台春晚首席AI合作伙伴
1月25日,百度发布文心助手关于春节现金红包活动的通知。自1月26日至3月12日,用户在百度APP使用文心助手,就有机会瓜分5亿现金红包,最高可获得1万元奖励。此外,百度APP还将作为首席AI合作伙伴合作《2026北京广播电视台春节联欢晚会》,同时上线近百种春节

2026-01-25

腾讯官宣QQ秀回归:无需手搓,AI一键生成新形象
1月24日,腾讯旗下QQ宣布,全新QQ秀正式上线。用户在手机QQ内搜索“QQ秀”即可体验。经典QQ秀于2003年1月24日正式上线,此次更新恰逢QQ秀诞生23周年,也被不少老用户视为一次“情怀级回归”。作为QQ早期最具代表性的功能之一,QQ秀曾掀起全民“换造型”的热潮

2026-01-24

传阿里拟分拆平头哥独立IPO,又一国产AI芯片将上市
据彭博社报道,阿里巴巴集团已决定支持旗下芯片公司平头哥未来独立上市。知情人士透露,作为第一步,阿里计划对平头哥进行重组,使其成为一家部分由员工持股的企业,随后将探索独立IPO方案。不过,目前上市时间表尚未敲定,平头哥未来的估值水平也仍存在不确

2026-01-24

无人测试里程碑事件!国内首个“测试智能体”技术标准发布
在软件定义万物的数字时代,软件系统的复杂性正呈指数级增长。当微服务、云原生以及AI模型本身成为软件的核心构成,传统的软件质量保障(QA)体系正面临一场前所未有的效能革命。 1月19日,由中国人工智能产业发展联盟(AIIA)智能化软件工程(AI4SE)工作组

2026-01-23

2.4万亿参数!百度发布文心大模型5.0正式版
1月22日,百度在上海举行的文心Moment大会上,正式发布文心大模型5.0正式版。据介绍,文心大模型5.0基于原生全模态建模,参数规模高达2.4万亿,可统一理解并生成文本、图像、音频、视频等多种模态内容,面向复杂任务具备更强的综合推理与表达能力。在应用层面

2026-01-23