中国中医科学院谢琪主持完成的全国科技名词委科研项目“面向中医真实世界研究的术语字典编纂”(项目批准号为:YB2020007),最终成果为团体标准《中医真实世界研究医学术语应用技术规范》、专著《中医真实世界医学术语规范化研究》和计算机软件《中医真实世界研究术语字典管理系统》。课题组成员有:周洪伟、曹馨宇、王海涛、王雪玭、刘晨园、姚渊、林睿凡、张妮楠。
一 研究的目的和意义
信息技术的高速发展实现了真实世界研究由理念走向现实的重大转变。临床疗效是中医存在、发展的基础,现代临床流行病学和循证医学研究理念促进了中医临床研究水平的提升,随着信息技术的快速发展,近年来越来越多研究者尝试利用临床诊疗数据,通过挖掘分析而形成高质量的真实世界证据,真实世界的临床科研必将成为临床研究的主要模式。
医学数据是富知识型的,从语义层次对数据理解分析,构建面向中医真实世界研究的术语字典,是中医药传承创新的基础。语义关系是概念的外延,不仅包括词语与词语之间的同义关系、反义关系、上下义关系及局部与整体关系等,同时词语因不同的搭配、句式、语境作用,其语义亦能发生变化"。语义关系能清晰准确地描述概念间的内在联系",是构成知识体系的基本元素。从语义层次上正确理解术语概念及概念之间的关系,对中医药传承创新十分必要和紧迫。SNOMEDCT 是国际广为使用的临床医学术语标准,但由于中医学与现代医学模式的差异,其不能直接用于中医临床;《中医临床标准术语集》采用人工方式应用本体方法建立中医临床术语分类框架,但其框架未严格遵循本体的上下位关系,而是采用范畴学分类;《GB/T15657-1995 中医病证分类与代码》《GB/T16751.1-1997 中医临床诊疗术语(疾病部分)》这两部国家标准定义准确清晰,但实际应用中的常用术语存在对疾病名术语类属关系及其界定不够严谨、同位术语匹配不当等问题而未能建立与之的映射关系。
中医真实世界研究的术语字典构建工程量巨大、自动化程度低,如何准确、高效地抽取医案术语、提高构造术语字典的智能化程度成为亟待突破的技术瓶颈。构建中医术语字典,以信息技术为支撑推广中医学标准名词术语的应用,将在中医真实世界研究中发挥其应有的学术价值。
本研究基于中医概念信息模型与中医诊疗信息模型,通过自然语言处理与深度学习的方法自动标注、自动获取术语及关系;利用本体论的理论指导构建中医术语语义关系分类框架,旨在形成面向中医真实世界研究的术语字典。
二 成果的主要内容
在中医真实世界研究设计与实施中,医学术语的规范化应用,可从概念语义层次上保障临床信息被正确、便捷、高效的采集,并转化为可供科研使用的数据,更是来源于不同地域科研协作网络的临床数据能够进行有效汇聚、存储、转输与利用的关键。医学术语的规范化应用水平,直接影响到真实世界临床研究的效率与质量。我国医学术语标准的基础研究取得快速进展,相关的国家标准及行业标准陆续颁布,而在标准框架和术语收录范围等方面由于面向不同应用而存在差异,难以满足临床科研实际应用的需求。同时,以医学电子病历、电子健康档案等信息系统为主要业务平台的中医真实世界研究中,缺乏面向临床科研实际需求的术语应用技术,从而制约了标准术语在中医真实世界研究中的有效应用。
团体标准《中医真实世界研究医学术语应用技术规范》结合中医真实世界研究方法和中医术语特点,基于真实世界数据,对医学术语相关资料的收集整理,并进行了技术规范相关材料的补充,采纳了与规范内容相关的法律法规与技术规范、标准化工作的法律法规与技术规范等。撰写过程中,课题组对国内外与该团体标准相关的期刊文献与标准资料的系统检索、调研,对涉及到的真实世界数据、临床文档、概念术语、首选术语、同义术语、语义关系等术语进行了明确定义。
对真实世界研究中医术语字典构建原则与步骤进行了详细规定,确定了术语字典构建需遵循规范性、可用性、实用性、稳定性与动态性的原则。在确立结构框架时,标准要求根据临床科研工作所关注的症、证、治、效等不同时空属性的信息要素,结合中医临床文档的结构及逻辑描述,包括以症状、体征、诊断、治疗等主体分类,以及特征、程度等属性分类。在后续收录、审核、发布、更新术语时,要面向具体病种临床与科研工作的实际需求,以分类框架为基础,由临床科研人员将首选术语与经过规范化处理的常用临床术语、新术语按术语主体分类、属性分类存入术语字典,建立首选术语与规范化的常用临床术语之间的语义关系。团体标准的撰写遵循“科学性、实用性、规范性、可扩展性”的原则,旨在促进术语标准在中医真实世界研究的有效利用,并提高中医真实世界研究质量。
医学术语的规范化应用,能够保障临床信息被正确、便捷、高效的采集,并转化为可供科研使用的数据。获取医学命名实体及语义关系,通过对已有中医语义关系的分析,提炼中医语义关系的表达模式,建立中医临床术语间的语义关系,并根据术语的表现特征,通过机器学习与人工标注相结合的方法,更新、完善中医术语的语义关系,是术语规范化研究中的重点及难点。构建语义关系分类框架,针对获取的中医语文关系,提取语义关系所关联的语义类型,利用聚类方法细化语义关系所含信息粒度,建立新的语义关系分类框架是术语规范化研究中的核心。
中医学根植于中国传统文化的沃土,因而从某种方面可以说,中医学是建立在中国传统哲学基础上的,中国古代诸子百家哲学对中医理论建构具有举足轻重的影响。在中国传统哲学的影响下,中医学逐步发展形成了取象比类、整体观念等思维方式。而中医的隐喻思维和隐喻术语表达也在一定程度上阐释了中医学的科学内涵,并与中国传统文化紧密连接,造就了中医学独特的理论体系。中医学独特的理论是由独特的概念构成的,而这些概念则是由中国独特的语言所构成的中医术语来表述的。中医学术语不同于其他自然科学,在千百年的发展中,产生了历史性、人文性等特点,构成了中医学特色术语体系。受中医哲学和隐喻等表述的影响,中医语言的“文学性”“抽象性”“多义性”“模糊性”“文化性”“简洁凝练”“医哲交融”等特性,严重制约了中医术语工作的发展。
专著《中医真实世界医学术语规范化研究》首先对术语的基本概念、术语工作、中医术语的特点及挑战等术语学基础进行了详细的叙述。并对术语标准化工作做了全面系统的整理与总结,介绍了国际标准化组织(ISO)语言与术语(Language and terminology)技术委员会ISO/TC37 的工作和国际标准化组织中医药(Traditional Chinese medicine)技术委员会ISO/TC249 等国际术语标准的工作及其制定的标准。对于国内标准,介绍了国家标准化管理委员会(SAC)批准发布的国家标准、中医药领域有代表性的国家标准等中医药领域的行业标准,对于国内外中医药的各种标准获得了一个鸟瞰式的认识,便于查询和研究。中医药的术语浩如烟海,该专著还以中医儿科和痫病为实例,采用语料库的方法,进行了术语的规范化整理工作。专著将中医儿科语料库中经审核和去重获得的语料信息按儿童保健、新生儿病证、时行疾病、寄生虫病、肺系病证、脾胃系病证、心系病证、肝系病证、肾系病类、五官科病证、外科病证、小儿杂病的体系进行分类,获得与某一疾病相关联的儿科病名集合,再把集合中的每条语料信息进行疾病辨析,然后根据有关标准,找到有明确代表性含义的首选术语,其余的作为同义术语,并将每个疾病的病名集合按其症状表现、病因病机等定名原则进行划分,明确上下位关系,形成了中医儿科术语字典。专著还考察了富含癫狂痫相关论述的中医药古籍文献,研究其历史分布规律,探索其病名的演变过程,对癫狂痫的病因病机及治疗方法进行辨析,形成了痫病的术语字典,为临床认识并治疗癫狂痫提供了理论根据和诊疗思路。全书对认识术语、了解国内国际的术语动态和中医学术语研究等方面均有一定的参考和应用价值。
《中医真实世界研究术语字典管理系统》软件是实现中医真实世界研究下术语管理的重要工具,系统运用计算机与信息技术等,对中医药学各领域中的事物、现象、特性、关系和过程进行标记和概括,并为每个概念赋予指称形成概念体系,具有管理中医药术语研究、制作、更新、维护等功能,根据不同需求形成系列术语管理体系。该系统可以实现按编号、术语名称、术语定义、术语来源进行中医临床术语查询;增加术语到中医临床术语字典;修改中医临床术语字典中的指定术语的编号、名称、定义或来源;删除中医临床术语字典中的指定术语等功能。对支撑中医真实世界研究的术语字典管理、更新、推广与应用有积极作用。《中医真实世界研究术语字典管理系统》旨在解决中医临床数据在采集及信息传递过程中遇到的交流障碍等问题,提高中医临床数据的利用率和术语知识的转化率等。
三 成果的主要价值
中医临床术语是文本式数据和信息的重要载体和数据来源,对于信息获取和挖掘具有重要意义,医学术语规范化应用方法,能够保障“临床信息”能被正确、便捷、高效的采集,并转化为可供科研使用的“科学数据”。
本研究形成了《中医真实世界研究医学术语规范化应用技术规范》团体标准,提出了中医真实世界研究医学术语规范化应用的方法与技术,规定了基于真实世界数据进行医学术语收集、整理、分析和应用的一般原则和方法,将散在于不同医学知识本体的现有标准加以整合、组织,促进术语标准在中医真实世界研究的有效利用。
研究形成了专著《中医真实世界医学术语规范化研究》,对术语学基本概念、术语工作内容与流程、国内外术语标准研制进展、当前中医学术语乱象等方面等进行了调研整理,并以真实世界数据出发,选取中医儿科和痫病进行病名的规范化研究,构建中医儿科、中医痫病术语字典,以“一科一病”为例展示了构建中医术语字典的过程,为进一步研究和完善中医真实世界研究术语字典构建工作打下基础。
同时,研究形成了计算机软件《中医真实世界研究术语管理系统》,是真实世界研究背景下术语现代化研究、管理与应用的基础,能够更有效地促进大数据时代,现代信息技术在术语研究工作中的应用,提高工作的效率和质量。
综上,本研究通过制定标准规范、研发术语字典的信息化管理系统,并以实例进行示范,清晰而明确地提出了中医术语的规范化应用的方法,能够服务中医药科研单位、学校及相关企业,使更多中医药学者们、学生等参与进中医术语标准化工作中来,为推进术语工作的进一步科学、有效发展与应用提出新方法、新思路。