电子病历一体化建设,指通过电子病历的信息智能化提升医疗服务效率,改善就医体验和强化质量监管,全面建立完善的现代医院管理制度,是实施健康中国战略的重要一环。2018年,原国家卫生计生委相继出台了《关于进一步推进以电子病历为核心的医疗机构信息化建设工作的通知》和《关于印发电子病历系统应用水平分级评价管理办法(试行)及评价标准(试行)的通知》,强调各级卫生健康行政部门及相关医疗机构提高电子病历信息化水平,鼓励信息的安全共享,利用人工智能技术助力医疗决策和学术研究。
1.电子病历应用现状
电子病历(Electronic Medical Record,EMR)是现代医院管理制度中的核心临床数据资源,以电子病历作为推进院内信息化建设的方法是当今的主要发展方向。电子病历完整记录了医疗事件中的医患沟通、诊断、治疗和转归过程,以临床病历为例,它包含了患者从入院到出院的临床诊断治疗过程的主观记录与客观记录,如入院记录、首次病程记录、首次主治医师记录、首次主任医师记录、日常病程记录、出院记录、护理记录、检验检查报告等。正因为如此,病历书写质量尤显重要,它不仅是医疗机构行业水平能力的体现,而且因其具备法律属性,成为医疗纠纷中不可或缺的原始凭据,决定了医疗损害鉴定证据链条的可追溯性、真实性和完整性,其内容的缺陷将会给医疗机构埋下重重隐患。原国家卫生部发布关于《病历书写基本规范》的通知,旨在提高医疗质量和工作效率,并防止医患双方发生误解与争执,对病历书写的质量标准提出了明确要求。
低质量的电子病历记录往往与医务人员的经验、责任心相关,其缺陷常见于患者信息采集不完整、病程记录因复制粘贴导致的雷同与错误、病历内容书写不完整和文字多错漏导致的语言表达不清。此外,医疗内涵的处置不当也给后续基于电子病历的诊断、研究和鉴定带来了困难,如诊断的主次颠倒、男女患者性别专用词汇的错用、排他互斥文书的表达和重要检验检查及药品的不当使用等。高质量的电子病历意味着医务人员需要翔实地记录完整的诊疗过程,而且必须符合严格的病历规范。在实际操作过程中,这往往意味着大量的时间成本。鉴于我国当前的医疗机构医生配比远远低于国际水平,上述要求加大了医务人员工作时间和服务压力。
针对上述问题,国内外学术界和工业界开展了大量工作,尝试通过大数据分析和人工智能技术来减轻医务工作者的病历书写工作,从而缓解医务人员的服务压力。Mrinal、Oren和Dongha利用生成模型来完成病历的生成,其结果在下游任务中的表现不错,但生成模型仅在整体概率分布和真实数据一致,而无法实现个体的***构建。科大讯飞提出了一种整合语音和体征数据等内容的病历生成方案,其利用类似翻译的方式来完成文字的生成,但其极大依赖语音输入,对实际使用场景有一定的要求。
与传统的仅独立基于文献知识或者临床知识的医学辅助决策系统不同,提出一种基于临床数据和文献数据的多源智能服务系统(Multi-source Intelligence System,MSIS),与前者有着明显区别。究其原因在于患者实际情况往往较文献中的情况复杂,尤其是拥有多种基础疾病的老年患者,故而需要利用临床医生的实际经验来补充和完善治疗方案,这样能够兼顾两种知识的优点。系统构建流程如下:首先对临床电子病历和文献数据进行医学自然语言建模,进而完成文字内容的结构化,并对结果用主数据表述和特征提取,随之完成高维矢量预测模型训练和专病知识库的构建,***后基于上述模型提供智能服务。整个系统提升了医务人员的病历书写效率,加强了电子病历质量控制,减轻了科研教学中繁杂的病历预处理工作。
2.基于临床数据和文献数据的MSIS构建
2.1 构建医学自然语言模型
医学中大量信息均为文字信息,比如电子病历、文献指南等。这些知识要被计算机利用起来,首先需要解决知识表示的难题。后结构化的自动训练方法适合在拥有大量医疗数据的场景下,围绕专科知识的标记对数据进行分解和归类,并进行自动化的训练学习。以我院某专科1万余份临床病历数据和近200份专科诊疗文献,包括教科书、临床指南等专业文献为源数据,设计26类文本标签,对应医学文字中的关键信息即实体信息,并依据上述标签由医疗专家完成人工数据标注。经过多轮反复的标注和训练工作,***后得到1个针对专科的医学自然语言模型,它能***限度地识别出医学实体,且对同类文字具备一定的泛化能力。实体提取完成后,下一步需要对实体信息组合进行“规范化”操作,即使用标准化术语屏蔽主管语言表达的差异。依据具备国内专家共识的国家临床版2.0疾病诊断编码(ICD-10)、中国医疗服务操作分类与编码(CCHI)等权威数据标准建立主数据集,并利用其表达症状/体征、检验检查、疾病诊断、治疗处置(手术等)和用药处方等信息,完成结构化操作。比如,将“喉咙痛”和“咽部疼痛”等有相同意义的文字均映射为“咽痛”。与英文不同,中文字词处理上还有很多细节需要注意,例如缩略语的拆分,比如“二便”拆分为“大便”“小便”,实现“***小粒度”内容表示,为后续计算机处理提供良好的数据基础。
2.2 构建医学知识库
完成结构化的临床知识和文献知识,被用于构建医学知识库。首先,使用文献知识构建基础图谱,以疾病诊断为核心,将症状/体征、检验检查、治疗处置(手术等)、用药处方和人体部位建立与之关联,并依据文献中提及的关联度,比如症状的发生频率设置其关联强度。因为,文献一般均用较含糊的字眼描述,如经常、偶尔等,故其数值化仅能简单映射几个门限,与实际数值不完全相符。而临床数据能较好地反映当地患者特征的分布,尤其是对于数据量大的诊断,其症状等特征的概率分布可以作为有效的补充,将其按照一定的规则去修正关联强度。文献信息中治疗手段和药品表述一般均指代一个较大的范畴,而临床数据正好能够将信息“明晰化”,而且也能体现在特定条件下(如多种并发症)多种治疗方案的融合。另外,医学信息中还有相当大一部分很难用图谱的方式即点-线-点的逻辑表示出来,因此,还需要构建大量规则作为补充,完善复杂逻辑的表示。
2.3 高维矢量预测模型和可解释架构
在医学知识的使用中,图谱和规则都存在着不足,前者表达能力略显不足,而后者在数量大时效率太低。为此,还需要设计一个方法,来缩小规则的诊断搜索空间,本研究采用了高维矢量预测模型。该模型以结构化后的信息构建高维矢量,充分包含各种信息,如二值化信息,如发热是否发生;多值化信息和onehot信息,如大便形态和颜色;连续数值信息,如咳嗽时间、年龄等。该模型对于特征关联表达能力较强,广泛应用于推荐系统中。高维矢量预测模型可以和图谱预测一起使用,集成为一个“强分类器”。同时,在集成的过程中,也能用两者重叠部分实现可解释性,从而构成一个“可解释的人工智能”(Explainable Artificial Intelligence,EAI)。 通过EAI,有助于辅助医务人员相信预测模型推荐诊断的准确性与公平性。比如,病历中出现“啰音”,依据知识库能够解释患者有极大的“下呼吸道疾病”可能。基于电子病历的疾病预测流程
3.MSIS的应用研究
通过高维矢量预测模型训练和专病知识库能够提供预测、推理等多种智能服务,可以介入病历生成的多个环节,提高其过程的智能化。
3.1 入院记录
入院记录涵盖了推断信息即入院诊断,主观信息即一诉五史——主诉、现病史、既往史、个人史、婚育史、家族史等,客观信息,即辅助检查、体格检查(含专科情况)等,能够完整地反映出患者的情况摘要。主诉是患者在入院时的记录内容。现病史主要包括疾病的历史既往相关情况。既往史包含了对患者过往疾病史、传染病史、预防接种史、手术外伤史、输血史、食物过敏史和药物过敏史的情况确认。个人史是对患者生长生活情况的简要补充。婚育史即记录患者婚育情况及配偶和婚生子女的健康情况统计。家族史是对父母健康情况及家族是否有相关疾病史的确认。辅助检查用于记录患者过往时间的检查、地点和结果的收集。体格检查包括了人体解剖和机能发展水平的一系列查验情况。专科情况是针对科室内部的重点检验检查指标所进行的细分关注内容。入院记录辅助诊疗示例。
入院记录的信息完备性要求较高,依据入院诊断或初步诊断,可以利用知识库实现关联推理,完善其关联性强的症状和体征(及其对应值),呈现出完备的且具有地方性特点的专病书写模板,使得医务人员能够轻松便捷地对诊疗过程进行详细记录工作。当完成入院记录的情况勾选后,通过系统的辅助诊断功能可以根据患者特征给出推荐的诊断及排序。***终,临床医生根据自身经验,对辅助诊疗系统生成的推荐文书进行二次确认补充,形成诊断意见。
3.2 三首记录
三首记录包含了首次病程记录、首次主治医师记录和首次主任医师记录,这些文书着重体现医生诊断逻辑,其中病情补充、诊断依据和鉴别诊断为***重要段落。记录中的病历特点和入院诊断均可通过前序流程中的书写内容自动化生成。通过对入院记录和病情补充的分析,依据知识库推断其诊断依据,继而依据不同的阳性特征和阴性特征筛选出***常见的鉴别诊断。
上述两者的内容均根据患者实际情况自动生成,避免了常规模板中“疏漏修改”等问题。在诊断确定后,能够依据主要诊断和并发症,选择匹配相似病例,进而推荐诊疗方案,***可能地保证其有效性。
3.3 日常病程
日常病程是对患者日常治疗情况信息的跟踪记录,依据知识库分析,将其治疗过程***关注的症状变化填充到预置文字中,保证医生引起足够的重视;同时,系统自动拉取尚未记录过的重要检验检查结果,为医生调整治疗方案提供信息支持。
3.4 出院记录
出院记录是对患者在本院诊疗的过程与结果的归档总结记录,其绝大部分信息都存在于之前的文书中。因此,基于入院、三首、日常记录,系统可自动生成入院情况、检查结果、治疗经过、出院情况,并可根据出院情况推荐出院医嘱。
3.5 质量控制
因为多源智能服务系统的介入,病历生成的过程也是质控的过程。基于知识库的推理和分析,提高了信息的完备性。
另外,因为人工输入的存在,难免会出现错别字,例如“黄疸”写成“黄胆”,“弥漫”写成“迷漫”,“新康泰克”写为“康泰克”等。针对上述现象,通过对病历中常见的假借字、自造字和错误省略词语收集,增加了错别字模型,该模型不仅包含传统的字典查询,也利用之前的医学语言模型将文字概率出现小的情况归结为错误,大大提高了随机错误的检测能力。
医务人员经常通过对过往病历的复制、粘贴和修改来完成病历文书的书写。这种习惯导致了临床记录会出现主次混乱、冗长无序、检查和药品的不当使用等内涵不一致的现象。利用结构化信息对比,可以发现内容不一致的情况,如修改主诉后忘记修改现病史;利用知识库推理知识图谱,能够对内容进行内涵分析,出院记录中2型糖尿病为主诊断,在治疗过程中主手术描述“全麻下行‘腹腔镜胃旁路术+食道裂孔疝修补+腹壁整形+引流管引流’”,两者不匹配,系统给出质控提醒。
4.系统上线和结果分析
MSIS在我院上线1个月,临床医生的病历书写时间得到了大幅降低,主要文书书写时间平均缩短60%,出院记录升幅***明显,约75%。除书写时间外,病历书写质量得到了较大的提升,医生反映内容完整性良好、错别字率低,上下文连贯性和诊疗合理性也得到了较高的肯定。同时,自动生成的文书语言非常规范,故结构化正确率相当高,在院内科研上可以随用随取。综上所述,MSIS达到了在数据源头保障质量和提高效率的目的,为电子病历一体化打下了坚实的数据基础。
5.小结与展望
通过MSIS系统的使用,提高了病历文书规范化,并且减轻了医生的工作负荷,有效解决了电子病历一体化的信息化和结构化两大难题。随之生成的病历信息能够方便地用于检索和学术研究[10-11],在质量保证的基础上大大降低了病历预处理的时间成本。MSIS系统在使用过程中,还发现了诸多尚待完善的部分。首先,自动生成病历文书在语言自然度仍有较大的改进空间;其次,检查报告分析能力还有待提高;第三,对于临床数据较少的诊断,其知识库因为临床数据不足,往往无法达到满意的效果,需要调整实现方案来改善性能。此外,电子病历一体化建设的另一个挑战在于数据共享的安全性,数据共享过程中涉及到的角色多、业务复杂,责任较难鉴定。因病历数据的敏感程度高,管理者普遍因担心承担泄露患者隐私身份的风险而不愿开放分享数据。如未来将MSIS与隐私安全计算技术相结合,质量与安全的双重保证将会使医学数据的可用性达到一个新的高度。