医疗数据的价值越发凸显,如何挖潜数据价值,使之成为数字资产,成了很多医院关注和探索的重要课题。在此之前,科学、有效地进行数据管理,自然是必经之路。
在11月22日由中国信通院主办的“健康医疗数据管理能力成熟度评估(DCMM-health)研讨会”上,首都医科大学附属北京友谊医院信息中心主任王力华,分享了该院在数据管理方面的探索和实践。医新苑对相关内容做了整理(有删减),以飨诸君。
实现数据资产有效管理
北京友谊医院的临床科研大数据平台,目前已上线5年。月均页面浏览量30000+,结构化编辑器的使用量130+,一年内创建了491个科研项目,留存326个,科研人员导出数据进行科研分析的项目87个。
科研大数据平台在2024年进行了升级,丰富了很多功能,实现了数据资产的有效管理。经统计,北京友谊医院截至目前接入约4TB数据量,已接入10个业务系统数据(文本),17个数据库,95.66亿条数据。且每个系统的数据均有时间呈现,数据时间范围最早可追溯到2003年。根据数据的完整性、准确性、关联性、一致性等多方面质量规则指标,设置了271条数据校验规则,根据校验规则进行数据扫描验证,数据整体质量达90分(满分100分)。
数据分级分类管理
参考国标《GB/T 39725-2020 信息安全技术 健康医疗数据安全指南》及《广东省健康医疗数据安全分类分级管理技术规范》,北京友谊医院科研数据中心建立了数据分级分类保护制度,将数据的安全等级分为5级,根据业务划分了5大数据业务域,包括临床、科研、运营管理、医疗管理、健康管理,每个业务域下进行了更为细小的分类。
经过分级分类的科研数据,更有利于进行科学管理。
首先是进行数据安全分级。数据安全级别的设置可以按照数据库、表、字段设置数据安全级别,拥有低级安全级别的用户不能查看高安全级的数据;或者根据不同条件设置脱敏显示数据, 例如:患者的个人信息脱敏显示,HIV的患者脱敏显示。
其次是进行数据加密存储。科研数据中心涉及个人信息的数据在数据库中为加密存储,浏览患者数据脱敏显示,包括:患者的身份证号、手机号、地址、姓名、出生日期、登记号、门诊号、病案号等。
再次是进行脱敏展示。参考数据安全级别以及数据应用场景,实现对数据库查询和浏览的脱敏展示。
主动发现数据质量问题
质控是数据管理的难点之一。
北京友谊医院通过数据规范化(业务系统数据治理)、数据资产盘点、制定数据规则、数据校验,形成了数据质控的完整闭环。
目前,科研数据中心的数据质控规则达271条。王力华举例,有医院科研人员在调数据时,可能会发现得到的数据比预想的少,这是因为科研大数据平台已自动筛选出来高质量的能满足科研需求的数据。
“我们的目标是主动发现数据质量问题,构建一个高质量数据服务平台。”王力华说。
数据管理的应用
在主数据管理方面,主数据服务增加至118个,并根据实际业务场景需求进行了多种类型的数据映射。包括HIS值域映射、上报数据映射、运营系统值域映射、院感系统值域映射等。“主数据管理好了,才会有高质量的数据。”
在做好主数据管理的基础上,患者主索引管理,同样是重要的一环。北京友谊医院通过自动+人工的方式合并患者信息16.8万条,包括多就诊卡及三无人员患信息合并,体检、就诊患者信息合并,干保患者信息合并,新生儿信息合并等。
多种方式开放科研数据
在北京友谊医院,常规数据统计需要需求人在BI报表中自行查询,医院BI系统包括9大主题,23个分类,307报表,共400多个指标,基本能满足常规查询。非常规数据,则需要需求人在OA上提交申请,经科主任、职能科室审批后,统计室执行。
科研数据的共享,有更为严格的流程。
北京友谊医院科研处和信息中心共同制定了科研数据共享的申请流程,需要申请人签署协议、上传伦理批件等操作,经科研处先批准,信息中心再批准后,申请人方能获得相应数据导出权限。
为了对这些敏感的科研数据进行控制,北京友谊医院还进行了其他尝试。
医院在科研大数据平台上设置沙箱功能,相当于为科研工作人员提供了一个专属工作空间,让他们在那里对科研需要的数据集进行数据利用和分析。这样就能保证数据不会流出。
此外,北京友谊医院还设置了云桌面数据分析功能。科研人员导出数据,需要多次迭代,成为制约科研的一个重要因素,而云桌面部署多种数据分析工具,课题数据隔离,数据可用但不可带离平台,从而保障了数据安全。