关键词:
糖尿病
中医临床指南
知识图谱
实体共现强度
大语言模型
Neo4j
摘要:
研究背景
糖尿病及其并发症全球发病率逐年升高。中医药在糖尿病及其并发症的防治中具有独特的优势,能有效控制血糖、改善症状、预防并发症。中医临床指南为中医医师辨证论治提供指导,但仍存在以下问题:(1)临床指南众多,其发布组织各不相同,从不同平台获取相对困难;(2)各实体间的关联关系复杂,难以直观把握。知识图谱作为一种可视化知识组织方法,能够有效解决上述问题,然而,现有知识图谱工具缺少中医特色显示功能,且不同组织对于同一疾病编写的临床指南有所不同,选择最佳治疗方案较为困难。本研究构建面向糖尿病及其并发症中医临床指南的知识图谱,并为其增加实体共现强度显示功能,旨在增强中医临床指南的可读性,并挖掘潜在的知识规律。
研究内容与方法
(1)糖尿病及其并发症中医临床指南知识图谱构建:收集和整理43项中医临床指南文献,涵盖国际组织标准、团体标准、期刊论文和专著。遵循领域本体七步法,设计符合中医理论特色的知识图谱逻辑结构。开发融合DeepSeek大语言模型的实体关系联合抽取方法,通过提示词工程技术实现16种实体类型和12种关系类型的知识自动化提取。利用Neo4j图数据库平台完成知识图谱的构建与存储,实现知识的结构化组织。
(2)知识图谱实体共现强度权重研究:设计包括关系频率、正向条件概率、逆向条件概率和TF-IDF四种共现强度计算方法,从不同角度量化实体关系的重要程度。将计算结果作为关系属性导入Neo4j数据库,并基于***开发可视化工具,构建交互功能模块,实现知识图谱的可视化展示。将检索模块接入大语言模型,通过提示词工程实现自然语言到Cypher查询语言的转换,降低用户使用门槛,提高知识获取效率。设计灵活的布局算法控制模块,支持自由布局、力导向布局和层次布局三种可视化方式。
研究结果
(1)知识图谱构建结果:构建包含症状体征、证候、治则治法、方剂、中药饮片等在内的16种实体类型共5050个实体、12种关系类型共4233个关系的糖尿病及其并发症中医临床指南知识图谱。其中症状体征1240个、治则治法630个、方剂582个、中药饮片417个、证候261个。知识图谱覆盖了糖尿病及其主要并发症的核心知识,实现了知识组织的结构化与系统化。
(2)实体共现强度可视化设计结果:实现了关系频率、正向条件概率、逆向条件概率和TF-IDF四种共现强度计算方式,揭示了不同应用场景下的知识关联模式。例如,在证候与症状关系中发现,“风痰阻络,证候所见,头晕目眩”关系的TF-IDF高达8.136,证明头晕目眩可作为风痰阻络证候重要的鉴别症状;检索气阴两虚证的治疗方案时,生脉散的逆向条件概率最高,表明其为治疗该证型的首选方剂。
(3)知识平台功能:开发了视觉效果控制器,支持节点外观和关系外观的精细调整;构建三种布局算法控制模块和物理布局功能,实现动态知识展示;融合大语言模型的AI检索助手。
研究结论
(1)将实体共现强度理论系统应用于中医临床指南知识图谱构建,以糖尿病及其并发症中医临床指南知识图谱作为实例,构建了融合实体共现强度的知识图谱。
(2)开发了融合DeepSeek系列大语言模型的实体关系抽取方法,探索将大语言模型融入实体关系抽取任务的可能性。
(3)实体共现强度分析方法在中医知识发现中的有效性得到验证:频次适合发现常见关系;正向条件概率适合判断实体关系的专一性;逆向条件概率适合确定治疗方案选择概率;TF-IDF则在鉴别诊断中发挥重要作用。
(4)融合大语言模型的知识检索模块降低了系统使用门槛,提高了知识获取效率,为临床辨证论治提供了规范化参考。