大模型助力嘉兴妇幼:数据分类分级的智能化飞跃
在医疗行业数字化转型进程中,数据已成为驱动服务升级与业务创新的核心要素。作为医疗行业数字化的探索者,嘉兴市妇幼保健院携手美创打造的智能化数据分类分级项目,数据识别率和分类分级率高达99%+,分类分级准确率达90%+,与传统分类分级方式相比,大幅节省90%以上人力成本;分类分级结果通过标准化接口实时同步至数据安全产品,高效构建差异化数据安全防护体系,树立医疗数据治理新标杆。
嘉兴市妇幼保健院始(以下简称:嘉兴妇幼)建于1932年,是一所集医疗、保健、科研、教学为一体的三级甲等妇幼保健院。这里拥有先进的设施,像 LDR 一体化产房、新生儿重症监护室等,年分娩量超 1.5 万例。作为国家级爱婴医院和母婴友好医院,率先开展无痛分娩、胎儿医学等特色技术,荣获全国妇幼健康服务先进集体等诸多荣誉。
现状分析
在医疗数据整合的行业发展浪潮下,嘉兴妇幼正围绕LIS、HIS、RIS等各类核心业务系统推进数据中台建设。现阶段,计划引入数据分类分级技术实现医疗数据的规范化、有序化管理,并以此为基础,建立精细化的数据安全防护体系。然而,经多轮调研分析发现,传统数据分类分级方法存在显著局限性:
合规落地难:缺乏专业可落地经验,难以依据合规要求开展工作;
识别效率低:数据识别率和分类分级准确率低,医院核心系统字段多为拼音缩写且缺乏注释,语义识别困难;
持续运营难:业务扩展带来字段新增或数据量变化时分类分级结果无法及时更新;尤其传统产品过保后,依靠人为更新,难以支撑海量数据分类分级工作。
2024年,随着AI大模型技术兴起和应用,嘉兴妇幼信息科主任沈碧飞敏锐察觉到AI的巨大潜力与变革性力量,迫切希望能通过智能化能力解决当下数据分类分级识别率低、准确率低、效率低、难以持续运营的难题,全面实现分类分级的提质增效,并将结果实时应用于业务侧取数用数、地市级数据同步、运维侧三方和远程连接等各类数据安全场景,以达到数据安全合规的目标。
解决方案
经过层层筛选比对,最终嘉兴妇幼携手美创科技,基于美创数据安全分类分级平台V3.0为医院构建智能化数据分类分级体系。
美创数据安全分类分级平台V3.0,基于AI智能化技术,动态发现并精准识别国家、组织和个人安全的各类数据,形成符合行业诉求的数据资产目录,以满足数据安全合规及精细化安全防护等诉求。平台内置医疗行业分类分级标准,提供智能暗数据发现、智能化分类分级、智能运营、及结果赋能等核心功能,助力嘉兴妇幼有效解决数据分类分级识别率低、准确率低、效率低、难以持续运营的难题。
核心功能:
内置分类分级标准
平台内置多年实战经验沉淀的医疗行业数据安全分类分级标准,标准依照《WS/T 787—2021国家卫生信息资源分类与编码管理规范》《卫生健康行业数据分类分级指南(试行)》等医疗行业分类分级规范,明确了各类医疗行业的业务术语对应的所属分类、所属分级、及分级依据等内容,用户无需自行解读标准,即可实现分类分级标准的一键调用,有效解决用户缺乏分类分级经验的难题,同时,平台提供了医疗行业分类分级法规知识库,方便用户进行分类分级标准的合规溯源。
图:内置医疗行业分类分级标准
智能暗数据发现
平台具备智能暗数据发现能力,全方位扫描数据中台、自动探测表结构,通过采集「Schema、表、字段」元数据、数据抽样、计算数据规模等动作,输出元数据清单,同时,平台智能识别主副表、关联字段等数据关系,以提升分类分级效率。
智能分类分级
平台融合识别规则、NLP、大模型等多种智能化能力,实现高效、精准分类分级。
·智能语义识别:基于元数据清单和样本数据,一键作业智能精准识别语义,经验证,嘉兴妇幼平均分类分级识别率高达99%以上,有效解决了字段名拼音缩写、缺乏注释等难以进行语义识别的难题,大幅降低了人工介入成本。
·智能化分类分级:依据产品内置的医疗行业分类分级标准对字段进行智能化分类分级匹配,经统计,嘉兴妇幼基于大模型的分类分级率达到99.32%,准确率高达90%+。
分类分级数据目录
分类分级作业结束后,平台自动输出多视角的、完整的分类分级目录详情,同时,针对分类分级结果分析,提供可视化展示,让数据安全状态一目了然,比如敏感数据占比、数据分级分布、数据敏感指数等关键信息都清晰可见。
图:分类分级目录
智能运营
针对频繁发生字段变更后分类分级结果无法随之变更、传统产品过保后无法支撑海量变化数据的分类分级等运营困扰,美创数据安全分类分级平台V3.0通过持续提升分类分级识别率、准确率及结果时效性,确保分类分级可持续运营:
·自适应分类分级:支持对源数据及元数据进行持续监测,针对增量变化、字段变更等数据,动态调整分类分级结果,如针对数量发生明显变化的数据,自动计算其数据量,根据分类分级标准动态升降安全级别;
· 分类分级结果持续反哺:支持将已确认的分类分级结果一键更新到标准中,如陌生业务术语及其分类分级结果更新至标准后,可在后期的分类分级作业中高效复用,持续提升识别率和准确率。
结果多态赋能
平台通过标准化接口,将分类分级结果自动赋能至数据安全产品。嘉兴妇幼同步至 DSC for 防水坝,借助其内置权限模版,实现数据自适应安全防护,解决了分类分级结果难以应用的问题。
项目价值
嘉兴妇幼保健院智能化数据安全分类分级项目的成功落地,验证了AI技术与行业场景深度融合的无限潜力,实现了从“人工经验驱动”到“AI智能驱动”的跨越式升级,为医疗行业数据合规与安全治理提供了可复用的方法论。
降本提质增效
AI智能化技术赋能下,数据识别率从40%提升至99.7%;分类分级准确率从30%提升至90%;有效降低人工参与确认量,节省90%+人力时间成本和合规工作门槛。
此外,通过输出动态资产台账,助力嘉兴妇幼全面掌握数据资产现状。
结果多态赋能
分类分级结果实时赋能至数据安全产品,实现数据运维、取数用数等场景的数据安全精细化防护,充分释放数据价值。
为医疗应用、临床科研、医院管理等各类场景提供合规、可靠、时效性高的分类分级结果,真正实现“数据驱动业务”目标。