大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

解锁医疗循证模式!国内首个全场景深度思考模型发布

商业范儿 2025-01-24

1月24日,百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview。该模型是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型。在数学、代码等多个权威评测中,Baichuan-M1-preview的表现均超越了o1-preview,展现了其在多领域推理方面的独特优势。

此外,作为国内唯一专注医疗领域的头部大模型公司推出的深度思考模型,它还解锁了医疗循证模式,实现了从医疗证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。

Baichuan-M1-preview现已在百小应中正式上线,在深度思考模式下不仅能准确解答数学、代码、逻辑推理等问题,面对复杂医疗问题,还能像资深医疗专家一样,通过深度思考构建严谨的医学推理过程,为用户提供全面的疾病分析和个性化健康管理建议。

为了更好地繁荣AI医疗生态,助力医疗事业发展,百川智能还同时推出了行业首个开源医疗增强大模型Baichuan-M1-14B,其医疗能力超越了更大参数量的Qwen2.5-72B,与o1-mini相差无几。

解锁医疗循证模式

作为一个全场景深度思考模型,Baichuan-M1-preview的能力全面,具备强大的语言推理、视觉推理及搜索推理能力。语言推理方面,其在AIME和Math等数学基准测试,以及LiveCodeBench代码任务上的成绩均超越了o1-preview等模型。

视觉推理方面,在MMMU-val、MathVista等权威评测中的成绩,超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等国内外头部模型。

Baichuan-M1-preview的另一大亮点是解锁了医疗循证模式。在面对复杂医学问题时,会将专业可靠的医疗知识作为推理依据,帮助用户做出最佳的医疗决策。

为实现这一能力,百川智能自建了涵盖亿级条目的循证医学知识库,囊括了国内外海量医学论文、权威指南、专家共识、疾病与症状解析、药品说明等专业医疗内容,且以天为单位进行动态更新,及时收录医疗领域的新突破、新进展。

众所周知,医学知识多样性强、因果关系复杂。因此,即使构建了庞大的医疗知识库,在调用其中的医学知识,尤其叠加了互联网上搜索到的医疗信息时依然会遇到部分医学数据、医学理论不一致的情况。

针对这一问题,医疗循证模式能运用医学知识和证据评估标准,对证据进行多层分级,并对不同权威等级的证据进行专业分析与整合,精准识别各类权威信息的来源和可信度,从而避免因信息混杂导致的误判,然后基于这些医学证据进行可靠、准确的医学推理,最终提供可信赖的医疗答案。

通过“医疗循证模式”,Baichuan-M1-preview实现了从证据检索到深度推理的完整端到端服务,能够有效地解决医疗场景中信息过载、不确定性和碎片化等痛点。无论是医生面对复杂病案,还是患者寻求权威建议,它都能通过“摆事实、讲道理”的循证方式提供言之有物、有理有据的解答。不仅能在临床场景中帮助医生提升诊疗效率,在医学科研场景中大幅缩短科研探索时间,还能帮助普通用户更好地理解自身健康状况,帮助患者科学管理生活方式,提升治疗效果。

行业首个开源医疗增强通用大模型

为了推动AI技术在医疗领域的创新发展,增强AI医疗技术的透明度和可信性,提高医疗服务的可及性,繁荣AI医疗生态,百川智能还开源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。

作为行业首个开源医疗增强通用大模型Baichuan-M1-14B的表现非常优异,不仅在cmexam、clinicalbench_hos、clinicalbench_hos、erke等权威医学知识和临床能力评测上的成绩超越了更大参数量的Qwen2.5-72B-Instruct,并且与o1-mini也相差无几。

为了提升Baichuan-M1-14B的医疗能力,百川智能在数据构建方面,面向细分医疗场景,收集了万亿级 token 的严肃医疗数据,涵盖了千万级的中/英文专业医疗论文、院内真实中/英文医疗病例,亿级的医疗问答、医疗问诊、临床数据等,还对全网数据进行了包括医疗科室、医疗内容以及医疗价值在内的分类评估,确保模型能学习到有价值且全面的医疗知识。

在此基础上,百川智能还针对病例、医学教材、医学指南等不同类别的高质量医疗数据生成了超千亿 token 的多样化数据,包含了医疗复杂决策推理链条、决策依据以及问答对等多样化形式。这些合成数据拥有丰富的知识呈现形式以及与医生一致的思维过程,进一步强化了Baichuan-M1-14B的医学知识能力和医疗推理能力。

进入到模型训练阶段,百川智能运用行业首创的多阶段领域提升方案,将整个训练过程分为通识提升、医疗基础知识提升、医疗进阶知识提升三个阶段,依次提升模型的基础语言、高阶及疑难病症应对等能力。此外还在 CoT 训练框架中创新的引入了ELO强化学习法,优化思维链路径,避免传统奖励模型偏差,有效提升了模型的生成质量与逻辑推理能力。

字节启动AGI长期研究计划,代号Seed Edge
1月23日,据媒体报道,字节豆包大模型团队已在内部组建AGI长期研究团队,代号“Seed Edge”,鼓励项目成员探索更长周期、具有不确定性和大胆的AGI研究课题。接近字节的知情人士透露,Seed Edge的目标是探索AGI的新方法,代号名中Seed是豆包大模型团队名称,Ed

2025-01-23

旅美经济学家向凌云教授在斯坦福大学发表重要演讲:探讨大数据背景下互联网金融风险管理
近日,著名旅美经济学家、国际金融风险管理领域的权威学者向凌云教授受邀在斯坦福大学发表主题演讲,题目为《Research on Internet Financial Risk Management in the Context of Big Data》。此次演讲围绕向教授近期发表于国际权威期刊的同名学术论文展开,

2025-01-23

生活服务春节消费前瞻:上海、北京、郑州酒旅订单领涨全国
蛇年春节将至,大众消费进入“过年模式”。1月22日,抖音生活服务发布春节前瞻消费洞察,呈现自1月14日春运开启后一周内的平台消费趋势。数据显示,节前“年夜饭”抖音团购订单量比去年同期增长93%,地道家乡菜预订火爆。1月14日至20日,以家政、美发美甲、洗

2025-01-22

百度文库联手百度网盘打破AI模态边界,“自由画布”开启公测
1月21日下午,在百度AI DAY活动现场,百度副总裁,文库事业部、网盘事业部负责人王颖透露,百度文库AI功能MAU已突破9000万,同时,由百度文库和百度网盘联合打造的AI创作新物种“自由画布”开启公测。

2025-01-22

阿里云第九代云服务器开启全球邀测,为AI时代提供普惠高性能算力
1月21日,印尼雅加达,在阿里云国际开发者大会上,阿里云第9代企业级实例 ECS g9i 正式面向全球开启邀测。ECS g9i采用阿里云自研「飞天+CIPU」技术架构,算力性能较第八代ECS最大提升超20%,开启eRDMA网络加速后,端到端场景应用性能最大可再提升50%,为AI时

2025-01-21