中国继续医学教育杂志社晁燕丽主持完成的全国科技名词委科研项目“国外医学术语数据库研究及其对我国术语数据库建设的启示”(项目批准号为:WT2019009),最终成果为论文《国外医学术语数据库浅析及我国医学术语库发展建议》。课题组成员有:杨威、乔政、邓明辉、陈艳梅。
一 研究的目的和意义
随着医疗机构信息化的不断深化,各种基于实际应用的临床术语标准化的需求日益增加;而临床实践的差异化越来越明显,医疗机构、科室之间的信息交换、共享、整合和利用因数据结构和表达的不同在一定程度上阻碍了医疗服务的标准化和规范化。虽然我国在标准化方面做了大量工作,制定和发布了一系列标准规范,但中文医学术语标准化研究和数据库建设进展相对比较缓慢,不能满足日益增加的临床医疗应用需求。本文通过查阅国内外近20年内的文献资料,调研国内外相关卫生术语标准开发组织的官网,收集相关信息,进行对比研究和分析,探寻我国医学术语标准化研究和数据库建设的可行性建议。
二 成果的主要内容
国内外医学术语标准化研究现状。国际上权威、主流的三大医学术语标准化机构和组织包括国际医学术语标准化与研发组织、世界卫生组织、美国国立医学图书馆。欧美等国外医学信息标准化发展较早,其医学术语标准化工作的开展经历由政府主导型向学术团体主导型过渡的历程。我国的医学术语标准化建设虽然起步较晚,但也有了长足的进步,国内的医学术语标准化组织包括中国标准化研究院、国家卫生健康委员会医院管理研究所、中国医学科学院医学信息研究所、中国中医科学院中医药信息研究所、中国卫生信息学会及其下设的卫生信息标准委员会、全国科学技术名词 审定委员会及其下设的医学名词审定委员会等。这些组织主要开展的是大量国际标准的引进和应用,包括ICD、ICPC、LOINC等医学术语及编码标准,并针对自身情况开展了标准的翻译、本地化研究与制定。
主要医学术语库主题领域、体系结构、数据库体量等基本情况。将国际主流、权威的世界卫生组织、美国国立图书馆、国际医学术语标准化与研发组织,以及中国国家图书馆、中国医学科学院医学信息研究所等标准化机构和组织建立的数据库从结构体系、主题领域、数据库体量三个维度进行汇总(见表1),从中可以看到我国医学术语数据库与国际主流权威数据库存在的差距主要是体系结构比较单一、数据体量较小、主题领域较宽泛。
表 1 主要医学术语标准概览

中文医学术语标准化研究和数据库建设现状和建议。通过对国内外医学术语标准化研究机构和组织的发展情况和对国外医学术语数据库的特点(基本单元、逻辑模型、概念模型和表达方式)进行研究和分析;认识到我国医学术语数据库存在的问题、建设的难点以及国内外的差距、优劣势等,探索中文医学术语数据库建设的可行性建议。
现有医学术语标准体系结构单一。从表1可以看出,中文医学术语标准化研究的主要机构是中国医学科学院医学信息研究所。此外前文提到的中国标准化研究院、国家卫生健康委员会医院管理研究所、中国卫生信息学会、全国科学技术名词审定委员会等机构和组织也具有医学术语研究职能。中文医学术语标准化和数据库建设若要缩小与国外的差距,依靠各个机构和组织自己的力量很难实现。政府和行业管理部门可以发挥管理优势,统筹兼顾,制定中文医学术语标准建设的中长期发展规划。大力扶持不同的医学术语标准化研究机构积极开展标准体系构建,形成百家争鸣的发展态势。只有从政府层面给予大力的投入和政策支持,进一步协调、完善医学术语数据库标准相关的管理法律、行政法规、规章和规范,整合及优化医学术语数据库相关资源信息,发挥合力,才能逐步建成和完善中文医学术语数据库。
现有医学术语数据库体量较小。国际主要医学术语数据库建设都是经过权威机构几十年的投入和积累才有现今的规模和影响。由于我国医学术语数据库建设起步较晚,并且人力和物力投入相对不足,造成中文医学术语数据库体量与国际权威主流数据库体量差距较大。中文医学术语广泛分布在医疗记录、医学文献等信息资源中,具有数量庞大、构词复杂等特点,不同表达方式的缩略语、外来语以及大量存在的一词多义、多词一义、含义不清(歧义)等现象大量存在;需要进行大量标准化研究工作以严格整理和筛选。
完善专业领域的术语数据库建设。我国医学术语数据库基本都是医学综合类领域,而国外还有生物学、解剖学、遗传学、肿瘤学、检验类、药学类等专门术语数据库。对专业领域术语标准化的深入研究对于提高医学专业领域的发展水平有至关重要的作用,应选取可以进一步提升医疗服务质量的临床医学领域加大投入,完善临床医学术语数据库建设。
临床医学术语标准化体系主要包括:疾病诊断术语、临床操作术语、症状体征术语、药品/生物制剂术语、医疗设备类术语等。可以将现有和正在开发的门诊电子病历系统、临床辅助决策和辅助问诊系统、门诊预付费系统等系统进行整合,逐步建立面向实际应用的临床医学术语数据库标准。在医疗服务标准化建设领域,医院/诊所学科建设标准化、医院/诊所质量控制标准化、医疗服务项目标准化、门诊JCI认证标准化、临床诊疗规范标准化、卫生信息标准化等方面可以先行一步,这样既可以解决临床医疗服务的标准化和规范化要求,又可作为临床医学术语标准化和数据库建设的基础组成部分。
加强医学术语标准化基础技术研究。医学术语体系在促进医学文献标引、检查、聚类和分析,以及各类卫生信息系统的卫生信息组织、描述、揭示与整合等方面发挥着重要的作用。建立医学术语数据库,需要整理大量的概念名词和医学标准术语,并进行概念、描述和相关性的映射分析, 工作量相当巨大和繁琐,依靠人工难以完成。尤其在大数据时代背景下难以满足日益高速增长的医疗服务质量标准化的需求。
部分国际权威主流术语集已完成了交叉映射和集成融合。面对种类繁多、数量庞大的异构临床医学术语,迫切需要可以包容各种术语源异构特征并与之建立准确映射关系的中文医学术语编码系统,用以医疗数据、信息和知识的整合与规范表达;同时需要基于计算机技术、针对中文的医学术语快速映射方法及相应映射工具,以快速、准确地实现异构临床医学术语字典的映射,减少人工工作量,提高数据集成融合效率。医学信息学高级人才的培养是重要的制约因素医学术语标准化研究和数据库建设需要有医学和信息学双背景的专门人才,但是我们的医学信息学人才储备明显不足,这种情况在基础性数据收集、整理、分类阶段的影响尚不明显,但是到了标准化研究和数据库建设的更高层面,需要进行医学术语数据库和标准体系的交叉映射和集成融合,对医学术语信息的组织与整合以及医学术语标准化进行关联分析时,只有专门的医学信息学高级人才才能胜任。
在中文医学术语数据库建设和完善过程中,那些需要加大政府投入和政策支持、加强宣传推广的内容相对比容易实现,而医学信息学高级人才的培养并不能一蹴而就。它需要完善的学科体系支持、实践经验的积累、更广的学科视野以及跨学科的知识储备,以上内容正是现阶段所缺乏的。因此,能否培养医学信息学高级人才是医学术语数据库建设的关键制约因素。