关键词:
主题模型
中医临床处方
Link-LDA
层次多关系主题模型
剂量
数据挖掘
摘要:
中国传统医学有着数千年的历史,它是我国独特的临床诊疗方法。它是一个致力于人体生理学,病理学以及疾病诊疗和治疗的一门临床学科。近几千年来,中国传统医学积累了大量的临床诊疗和理论数据。这些数据包括基本数据集,中国传统医学著作和大量的中医临床诊断和治疗的数据库及数据仓库。然而越来越多的人关注这些海量数据中隐含的规律,随之而来的是大量的数据挖掘算法在这些数据中的研究。如果能够从这些海量数据中挖掘出有意义的知识,将会极大的推动中医学术的发展。
本文基于主题模型的数据挖掘算法用于挖掘分析中医临床处方药-症的规律,该算法可以根据大量的临床诊疗处方数据挖掘出有特定含义的主题及主题中症状和中药的概率分布。通过药-症之间的规律就可以真正发现中医中有效的药-症关系及诊疗方案。
本文的主要研究内容是首先介绍了一种Link-LDA主题模型的方法去分析中医临床处方中药-症的规律,通过实验表明,我们能够挖掘出有效的主题,其中包含特定含义的症状集和与之对应治疗的中药处方集,在解释中医“辨证论治”思想有重要意义。其次,介绍了层次多关系主题模型,该模型主要结合了层次主题模型和Link-LDA模型,实现了药-症主题关系的分层结构,更能体现主症和并发症,主药和辅药的关系。最后,通过引入中药剂量的信息进行主题模型的研究,剂量在中药数据中有着特别重要的意义,剂量加权分析主题模型展现了良好的临床意义。