关键词:
不孕症
中医临床试验
领域本体
知识表达
摘要:
目的:疗效评价是中医药现代化研究关键性的环节,传统中医在疗效评价上多是经验性、主观性的总结,可重复性低,难以量化。目前,为提供中医临床疗效的最佳证据,专家学者往往通过开展一系列临床试验研究来证实中医药治疗疾病的有效性和安全性,随着流行病学和循证医学的快速发展与应用,全国各地中医药类院校纷纷开展中医药循证研究,中医临床试验文献数量得到了显著增加,但被认可程度远远不足。我们认为,原因除了前瞻性试验研究缺乏严格的设计外,由于中医流派众多且地域各异,多以师承家授相传,导致中医症状、证候、病因命名繁多且不统一,多为自然语言,本体强调规范性的概念及其语义关系,其构建目的主要体现在通过统一的术语概念集从而提供检索功能和模拟人脑构建领域内的知识体系,能够全面反映该领域内错综复杂的概念关系,其最终目的是实现知识共享。当前,大多数中医药领域本体没有充分发挥本体的优势和特性,本体构建方法单一,顶层本体复用缺失,术语映射缺失,往往侧重于已有结构化知识的整合,并未挖掘隐性知识。为实现中医临床试验知识的结构化表达,本研究以不孕症这一疾病为例,在七步法和骨架法的指导下,通过Protégé 5.5.0软件建立规范性术语词表、术语映射规则、多元语义关系模型,构建一个开放的、语义关系清楚、可验证的不孕症中医临床试验知识本体,同时在本体构建的基础上,采用数据挖掘方法挖掘隐性规律以补充完善知识本体语义关系。方法:首先以不孕症已发表的968篇中医临床试验文献为主要数据来源,同时参考《中国中医药主题词表》《中医临床诊疗术语·疾病部分》《中医病证分类与代码》(GB/T 15657-2021)等标准,收集规范本体中各个类涉及的相关术语概念,包含病因病机、病证、症状、操作/方法、干预药物、诊断标准、结局指标七大类,接着将不孕症中医临床试验知识本体中涉及的顶层概念与BFO、GFO、TCMLS进行对比,确定复用中医药学语言系统语义网络框架,之后通过Protégé 5.5.0软件确定类和类的层级结构,定义相关的对象属性、数值属性和注释属性,并进行术语映射,构建多元语义关系模型,初步生成不孕症中医临床试验知识本体。由于本体构建主要是对知识概念进行无差别的逐一罗列,仅仅是对已有知识的整合梳理,并未探索新知识和规律。因此,本研究在不孕症中医临床试验知识本体初步构建的基础上,采用频数统计、共现分析、TF-IDF算法发现不孕症常见病因的常规结局指标、特色结局指标及结局指标常见组合、对照措施常见组合、干预措施常见组合,以补充完善本体框架,最后通过推理机进行本体一致性验证和本体评价以确保所构建本体的质量。结果:该本体主要复用中医药学语言系统(TCMLS)中的语义网络框架,建立了不孕症相关的疾病、证候术语映射规则,将GB/T 15657-2021中不孕症涉及的术语与ICD-11进行编码交叉映射,完成不孕症证候术语映射51条,采用数据挖掘的方法对968篇文献涉及的知识进行分析,新增数据属性4条,最后共构建5804条公理,1210个类,8个对象属性,9个数据属性,4个注释属性,865条多元语义关系。结论:该本体的构建,基本实现了不孕症中医临床试验知识的语义映射及结构化表达,为后期多角度知识检索、知识标注、知识抽取奠定基础,临床医生可以按照相关的规范说明和执行程序来实现对不孕症中医临床试验知识的浏览检索,使得检索结果更为精确、全面,临床标准研究人员可参考该本体内容简化不孕症中医临床试验核心结局指标集制定流程,同时本研究也为国内外中医临床试验相关本体的构建及其它本体的构建提供思路。