大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

阿里发布Qwen3.5-Omni,多模态能力超越Gemini-3.1 Pro

ITBEAR科技资讯 2026-03-31

3月30日,阿里发布千问新一代全模态大模型Qwen3.5-Omni,在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。新模型拥有极强的音视频理解与实时交互能力,能够对音视频内容生成详细且可控的结构化描述,可识别语言和方言数量多达113种,还惊喜地涌现出了音视频Vibe Coding能力,用户对着镜头阐述需求,就能让模型自主生成APP、网页、游戏等复杂产品代码。目前,阿里云百炼已上新Qwen3.5-Omni的Plus、Flash、Light三种API,可广泛应用于短视频/直播平台、游戏、自媒体等行业。

Qwen3.5-Omni采用混合注意力MoE架构,在海量文本、视觉以及超过1亿小时的音视频数据上进行了原生多模态预训练,可实现图片、视频、语音、文字等全模态内容的输入与输出。新模型在音视频理解、跨模态推理、Agent方面实现了性能飞跃,在音视频理解、语音识别、多语种翻译、对话等215项第三方性能测试任务中取得SOTA。比如,在聚焦视听交互能力的DailyOmni、QualcommInteractive、Omni Cloze等测试中,Qwen3.5-Omni得分大幅领先Gemini-3.1 Pro;在检测嘈杂环境抗干扰能力的WenetSpeech测试中,Qwen3.5-Omni错误率远低于Gemini,识别准确率极高;在考察多语言语音生成质量的Multi-Lingual (30lang) 测试中,Qwen3.5-Omni同样显著优于Gemini-2.5-Pro-TTS。


图说:Qwen3.5-Omni跑分图

Qwen3.5-Omni拥有极强的语言能力,支持113种语言及方言的语音识别和36种语言及方言的语音生成,就连使用人数不足一百万的毛利语和国内的海南方言,也能精准识别。新模型还大幅增强了实时交互体验,能高情商听懂用户对话意图,准确区分有效回应和随口附和,就像和真人聊天一样。同时,模型还可以根据指令自由调节语音、语调,并基于创新的ARIA技术,使生成的语音更自然、更稳定。 在面对类似“今天的天气怎样”的实时提问时,模型还能自主判断并调用工具,确保回复内容准确且时效性强。

基于一系列技术创新,Qwen3.5-Omni将Vibe Coding推入下一阶段。与纯文本或图片驱动的Vibe Coding不同,千问可以实现音视频编程:打开摄像头,用户对着草图口述需求,哪怕是包括复杂产品逻辑的描述,模型也能直接生成带有复杂UI的产品原型界面,真正实现“动动嘴即可编程”。这一能力并非刻意设计,而是模型在原生多模态能力持续扩展过程中自然涌现出的结果。

Qwen3.5-Omni顶尖的全模态能力,还能为专业领域带来超级生产力。新模型可对画面主体、人物关系、对话逻辑、乃至人物情绪起伏进行极细的拆解,并自动完成视频章节切片与时间戳标注,支持超过10小时的音频输入,将繁琐的视频后期梳理工作缩短至秒级,大幅降低了企业的内容管理成本,在视频创作、内容审核等领域具有极高的落地价值。

目前,普通用户也可前往Qwen Chat免费体验,开发者和企业可通过阿里云百炼平台调用Qwen3.5-Omni模型,每百万Tokens输入不到0.8元,比Gemini-3.1 Pro的1/10还低。据了解,千问稳居中国企业级大模型调用市场第一,服务涵盖互联网、金融、消费电子及汽车等重点行业超100万家客户。

附:


图说:Qwen3.5-Omni跑分图

海信激光电视年度旗舰登场,探索 X1 Pro带来“客厅影院”新答案
5 月 20 日,海信激光电视举办线上新品发布会,正式推出年度旗舰力作 ——探索 X1 Pro。作为探索X1系列迭代升级之作,新品延续了海信激光电视在电影院同源技术、专业声场、健康护眼及一体化形态上的核心技术路线,以“好画质、好声音、真护眼、好内容、好安装

2026-05-20

从一片热土到行业灯塔:特变电工打造智慧园区落地范本
位于京津产业新城科创先导区的特变电工智慧产业园,2023年时还是一片热闹繁忙的建筑工地。如今,一座高端化、智能化、绿色化的综合性园区已经拔地而起,集中承载起特变电工的战略研究、科技研发、智能制造、人才发展及运营管理等核心职能。特变电工智慧产业园

2026-05-20

星动纪元拿下 RoboChallenge冠军!17项家务活斩获第一
截图日期:2026.5.20近日,全球首个具身智能大规模真机评测平台RoboChallenge最新评测结果正式揭晓,星动纪元(Robotera)的Era0模型在Table30真机评测系列任务中表现突出,成功率(Success Rate)与过程分(Score)两项核心指标均位居参测模型首位,分别达到

2026-05-20

京东AI领域再现高层调整 两大核心实验室负责人确定
5月19日,据网络消息,京东集团近期在AI领域进行了新一轮高层调整,进一步明确探索研究院核心技术团队架构。根据京东内部公告,王佳琦被任命为探索研究院自然语言实验室负责人,黄浩洋则出任图像与多模态实验室负责人,两人均向探索研究院副院长段楠汇报。资

2026-05-20

第四届中国AIGC产业峰会,近20位行业大咖共话AI产业变革
今日,由量子位主办的第四届中国AIGC产业峰会在京启幕。2026年,AI产业一路高歌猛进。从“龙虾”到“Harness”,爆款Agent接连出圈、风靡全网。面对层出不穷的新业态与新玩法,不少从业者和普通用户都感到困惑:如何找准AI的使用方式?怎样把握产业机遇?又该

2026-05-20