AI在线 AI在线

百川推出创新医疗大模型 M2Plus,降低医疗幻觉率显著

近日,百川大模型正式发布了其最新的医疗大模型 ——Baichuan-M2Plus,并同步升级了配套应用百小应,开放了 API 接口。 这一发布标志着百川在推出开源模型 Baichuan-M2后的又一重要进展。 通过一系列评测,M2Plus 在医疗幻觉率方面表现优异,较通用大模型显著降低,尤其在与现有医疗产品 DeepSeek 的比较中,幻觉率降低了约3倍,甚至超过了美国流行的医疗应用 OpenEvidence。

近日,百川大模型正式发布了其最新的医疗大模型 ——Baichuan-M2Plus,并同步升级了配套应用百小应,开放了 API 接口。这一发布标志着百川在推出开源模型 Baichuan-M2后的又一重要进展。

通过一系列评测,M2Plus 在医疗幻觉率方面表现优异,较通用大模型显著降低,尤其在与现有医疗产品 DeepSeek 的比较中,幻觉率降低了约3倍,甚至超过了美国流行的医疗应用 OpenEvidence。

核磁共振 医疗 (1)

图源备注:图片由AI生成,图片授权服务商Midjourney

M2Plus 采用了六源循证推理(EAR)范式,成为被誉为 “医生版 ChatGPT” 的智能助手。该模型针对严肃医疗场景中的应用难题,整合了原始研究、证据综述、指南规范、实践知识、公共健康教育以及监管的真实世界信息,构建了完整的医学知识体系,确保医疗决策的可信性和科学性。

在循证检索方面,M2Plus 利用 PICO 框架,将医疗查询转化为结构化问题,确保检索到的信息既精准又可靠。该模型的设计使得医生在面对复杂的医疗问题时,能够获得高等级、可信的医学证据,大幅提升医疗信息的使用效率。

更值得关注的是,M2Plus 在回答医疗问题时采用了 “循证增强训练” 机制,确保模型的回答不仅基于检索到的证据,还能有效避免随意生成信息的情况。通过强化引用权威资料并评估证据质量,M2Plus 展现出与资深临床专家相当的可信度。

在多次医疗场景的测试中,M2Plus 获得了临床医生的高度评价,尤其在分析病史、诊断思路和治疗方案时,其回答的准确性和专业性得到了广泛认可。此外,在美国执业医师资格考试(USMLE)中,M2Plus 取得了惊人的97分的佳绩,进一步证明了其在医疗领域的应用潜力。

划重点:

🌟 M2Plus 模型发布,显著降低医疗幻觉率,超越多款现有医疗产品。

🔍 采用六源循证推理(EAR)范式,确保医疗决策的科学性和可信性。

🏆 在 USMLE 考试中取得97分,显示出卓越的医疗专业能力。

相关资讯

最懂医疗的国产推理大模型,果然来自百川智能

年关将近,全球 AI 大模型却突然卷了起来。 就在本周,Kimi 的新模型打开了强化学习 Scaling 新范式,DeepSeek R1 用开源的方式「接班了 OpenAI」,谷歌则把 Gemini 2.0 Flash Thinking 的上下文长度延伸到了 1M。 种种迹象表明,进入推理增强赛道的各位玩家正试图在最近一两个月卷出个高下。
1/24/2025 3:33:00 PM
机器之心

百川智能发布全场景深度思考模型Baichuan-M1-preview 已在百小应上线

今日,百川公司宣布,其最新研发的Baichuan-M1系列模型正式面世,包括国内首个全场景深度思考模型Baichuan-M1-preview与行业首个开源医疗增强大模型Baichuan-M1-14B,两款模型均展现了卓越的性能与创新的技术特点。 Baichuan-M1-preview作为国内唯一同时具备语言、视觉和搜索三大领域推理能力的模型,其表现尤为亮眼。 在数学、代码等多个权威评测中,Baichuan-M1-preview超越了包括o1-preview在内的多个竞品,展现出强大的深度思考能力。
1/24/2025 2:04:00 PM
AI在线

百川智能发布开源中英文大模型,多个榜单评测成绩最佳

王小川创立的百川智能发布中英文大模型,采用开源模式,可免费商用。报道 | 机器之能2023年6月15日,被称为「中国ChatGPT梦之队」的百川智能公司,推出了70 亿参数量的中英文预训练大模型——baichuan-7B。baichuan-7B不仅在C-Eval、AGIEval和Gaokao中文权威评测榜单上,以显著优势全面超过了ChatGLM-6B等其他大模型,并且在MMLU英文权威评测榜单上,大幅领先LLaMA-7B。目前baichuan-7B大模型已在Hugging Face、Github以及Model Sc
6/15/2023 6:13:00 PM
机器之能
  • 1