中国信通院医健大模型效能评估结果出炉，第一名是？

近期，中国信通院对包括GPT-4Turbo、GPT-4O等国际通用大模型，文心一言、通义千问、混元和智谱清言ChatGLM等国内通用大模型，以及灵医Bot、夸克健康助手、讯飞星火医疗大模型和华佗GPT II等医疗健康行业大模型进行了效能评估。通过构建测试数据集、开展符合性验证和模拟实际应用场景，邀请医疗健康、人工智能领域十余位专家形成评估小组，对参测大模型的多轮问询结果进行准确性、完整性、流畅性、可解释性等维度的综合评分，考察大模型在多学科知识问答、多形式语言理解、多场景文书生成、多环节辅助诊疗、多轮对话交互、多模态支持等六大方向的实际应用效能。

结果显示，通用大模型在医学知识广度方面具有一定优势，医疗健康行业大模型在特定医疗任务上表现优异。其中，讯飞星火医疗大模型能力超越GPT-4Turbo、GPT-4O等国内外大模型，多学科知识问答、多形式语言理解、多环节辅助诊疗、多模态支持等技术能力排名第一。具体而言，在个人画像、健康干预方案、病历文书生成及质控、检验检查报告解读、体检报告单解读、药盒解读等细分任务中，讯飞星火医疗大模型表现均处于领先；在健康常识、疾病百科、用药知识、电子病历结构化、专业知识生活化、考试辅助智能化、导医导诊便民化、辅助首诊及推荐检验检查、辅助确诊、用药安全指导等方向上，讯飞星火医疗大模型展现了高度专业性。

近年来，中国医疗人工智能行业的市场规模显著增长。根据弗若斯特沙利文的资料，中国医疗人工智能行业的市场规模由2019年的27亿元增至2023年的88亿元，复合年增长率为33.8%，且预计到2033年将达到3157亿元，2023年至2033年的复合年增长率为43.1%。

而讯飞医疗已在中国医疗人工智能行业取得竞争优势。据公开资料显示，讯飞医疗主要经营四大块业务，分别是面向基层的医疗和疾病管理；面向医院的医院管理和诊疗辅助；面向患者的诊断、治疗服务；以及面向区域的公共卫生管理。根据弗若斯特沙利文的资料，讯飞医疗2023年的收入规模在中国医疗人工智能行业中排名第一，市场份额为5.9%。此外，其智医助理是全球首个且是唯一一个通过国家执业医师资格考试(综合笔试)的智能解决方案，2023年在中国基层医疗机构CDSS市场中排名第一，市场份额占61.5%。

中国信通院将继续联合医疗机构、科研院所、技术厂商等各界力量，结合动态效能评价工作经验，持续推进医疗健康行业大模型成熟度系列标准研制，建立针对不同医疗任务的大模型成熟度评价细则，确保标准贴合实际应用需求，促进能力提升和应用落地。通过优化评估数据集、构建自动化测试平台，打造可信、互信的产业生态，树立产业发展风向标，加强人工智能在医疗健康领域创新应用，释放数字健康经济新动能。