AI在线 AI在线

国内首例!由钉钉AI平台训练的豆蔻大模型通过妇产科主任医师考试

7月28日,壹生检康(杭州)生命科技有限公司研发的 “豆蔻妇科大模型” 成功通过国家妇产科卫生高级职称(正高)笔试考试,成为国内首个由创业公司在钉钉企业专属AI平台上训练达到该专业标准的垂直医疗模型。 这一突破性成果不仅标志着医疗垂直领域大模型研发实现关键跨越,更以鲜明的示范效应为行业提供了可复制的创新路径。 短时间从无到优,为行业打造专属大模型提供样本从技术攻坚到成果落地,豆蔻妇科大模型短时间内便完成从无到优的研发训练,并达到专业资质标准。

7月28日,壹生检康(杭州)生命科技有限公司研发的 “豆蔻妇科大模型” 成功通过国家妇产科卫生高级职称(正高)笔试考试,成为国内首个由创业公司在钉钉企业专属AI平台上训练达到该专业标准的垂直医疗模型。这一突破性成果不仅标志着医疗垂直领域大模型研发实现关键跨越,更以鲜明的示范效应为行业提供了可复制的创新路径。国内首例!由钉钉AI平台训练的豆蔻大模型通过妇产科主任医师考试

短时间从无到优,为行业打造专属大模型提供样本

从技术攻坚到成果落地,豆蔻妇科大模型短时间内便完成从无到优的研发训练,并达到专业资质标准。这一高效突破打破了 “垂直领域大模型研发依赖高投入、长周期” 的固有认知,证明中小型团队完全能够在专业训练平台支持下,通过科学的训练方法、高质量的领域数据与聚焦式技术攻坚,快速打造出达到顶尖专业水平的专属大模型。

作为技术突破的核心支撑,豆蔻妇科大模型以先进的基础模型为起点,依托钉钉企业专属 AI 平台和专业服务,通过高质量妇产科数据构建与多阶段优化训练方法实现性能跃升。

钉钉CTO朱鸿表示,豆蔻妇科大模型是钉钉AI平台上诞生的第一个专业垂类大模型,双方团队只经过短短一个多月的协作,就将模型准确率提升到了90.2%,并成功通过专业考试。这验证了钉钉帮助千行万业企业打造专属大模型的能力。“钉钉正不断完善行业/企业大模型建设支持体系,打造AI大模型按效果付费的模式,帮助更多像壹生检康一样的行业企业真正落地AI应用。”朱鸿说。

豆蔻妇科大模型的研发过程中,壹生检康和钉钉采用了“精准标注的高质量医疗数据+定制化训练工具+高效训练流程及方法”的技术路径,使得豆蔻妇科大模型能够快速迭代,也显著提升了模型的准确性和稳定性,使其在复杂临床场景中表现出色。豆蔻妇科大模型从数据准备、预处理到性能不断优化过程中的实践,为医疗乃至更多行业打造专业专属大模型提供了可复制的参考案例。

专业性超通用模型,豆蔻妇科大模型推动AI医疗普惠

国家妇产科卫生高级职称(正高)考试是衡量妇产科医生专业水准的金标准。该考试不仅涵盖女性生殖系统解剖学、临床妇产科学、生殖内分泌等 12 大核心学科知识,更着重考察复杂病例诊断、高难度手术方案设计等实战能力,要求应试者具备数十年临床积累的“临床直觉”。

本次笔试测评严格采用国家卫健委指定的人卫版《妇产科高级职称考试全真模拟卷》,考试范围覆盖临床妇产科学、妇科肿瘤、围产期医学、生殖内分泌、计划生育等 12 个核心学科,题型包含多选题(占比 40%)和案例分析题(占比 60%)两大题型。其中,案例分析题要求模型根据患者主诉、检查报告等多源信息,解决临床诊断、鉴别诊断、治疗方案等问题,全面考察临床决策能力,需要全部正确才能得分,评判标准高于人类实际考试标准。多选题正确率: 75.56%,案例分析题(不定项)正确率: 59.01% ,最终正确率: 64.94%,无论是多选题还是案例分析题正确率都要优于多个模型。为确保结果可靠性,团队采用三套独立试卷取平均分的验证方法进行验证。国内首例!由钉钉AI平台训练的豆蔻大模型通过妇产科主任医师考试

(对比基于同份的考卷)

“通过正高考试,意味着该模型已具备主任级医师的专业判断力。”壹生检康创始人王强宇强调,“我的实践证明,中小企业也能出训练高精度的大模型。”不过,王强宇也表示,大模型不会取代妇产科医生。其核心价值体现在:为女性用户提供居家自诊断支持,实现“术前分流”与“院外健康管理”;针对无需就诊的情况提供科普指导与生活建议;为医疗、医美等行业机构提供专业支撑,提升妇科服务质量,同时可通过机构的数据训练专科模型,让患者预问诊享受顶尖专家水平服务,提升医疗效率。

业内专家表示:“这一突破为 AI 在妇产科临床决策辅助、循证医学研究、患者健康教育、医学生学习考试等场景的深度应用开辟了新路径。”浙江大学医学院附属妇产科医院妇科周博士也对该模型给予了高度评价:“这一突破将为我们的工作带来极大便利,有助于提高诊断效率和准确性” 。

随着技术的不断完善和推广,豆蔻妇科大模型不仅有望在更多医疗场景中发挥重要作用,还将进一步优化医疗资源配置,缓解优质妇科医疗资源分布不均的问题。未来,该模型还将与更多医疗机构合作,推动医疗行业的智能化、高效化发展,为更多女性患者带来福音。

相关资讯

对标GPTs但没有创建门槛,应用层的AI Agent玩家终于来了

对标GPTs但没有创建门槛,应用层的AI Agent玩家终于来了

从此在钉钉上,你只需要给出指令,其他事情交给「AI 助理」来办就可以了。2024 开年伊始,大厂便开始卷 AI Agent 了。 过去一年,人工智能行业的风向标不断发生变化,最开始备受关注的是如雨后春笋般涌现的大语言模型及 AIGC 应用,接着又出现很多基于大语言模型打造的 AI 辅助应用(如微软 Copilot)。如今 AI Agent 成为激烈角逐点,是 AIGC 下一阶段的关键。 去年 11 月, OpenAI 发布 AI Agent 初级形态产品 GPTs,让人看到智能体的应用前景。谷歌、亚马逊在该领域也有
1/9/2024 3:06:00 PM 机器之心
钉钉AIGC实践!如何用AI一键设计工作台应用图标?

钉钉AIGC实践!如何用AI一键设计工作台应用图标?

钉钉工作台作为组织数字化的入口,不同企业通过工作台打造属于自己的门户,不仅可以帮助员工快速找到各种功能,更能成为打造企业组织文化的重要阵地,是企业品牌形象的一块亮眼招牌。一、为什么要AI生成应用图标 在客户案例中,典型行业大客户的自定义工作台体现了企业文化和品牌形象,样式设计也十分丰富多样。自定义工作台首页的图标通常会进行重新设计和替换,以更好地契合企业的品牌设计和文化氛围。然而在用户反馈中,我们发现这样的声音:有时客户企业内没有设计师无法进行个性化设计,又或者自行设计的效果不理想;有时已经进行了图标设计和替换,但
4/3/2024 12:01:22 AM 团队钉钉设计
中国AGI能否重演移动互联网的故事?

中国AGI能否重演移动互联网的故事?

轰轰烈烈的大模型浪潮,似乎正在进入一个煎熬期。6 月中旬,微软发布了一个出人意料的消息,他们将于 7 月份停止其推出仅三个月的 Copilot GPTs 服务。Copilot GPTs 可以理解为针对各种需求创建的智能助手,比如杂货 Copilot GPT 可以根据你发给它的膳食计划开列采购清单。这一服务和 OpenAI 的 GPT Store 非常相似。而且,后者同样未能成为市场宠儿:数字解决方案公司 CTOL.Digital 的一份报告估计,GPT Store 的流量不到正常 ChatGPT UI 的 2%。要
6/28/2024 3:13:00 PM 机器之心