关键词:
知识图谱
大语言模型
智能问答系统
中医课程
摘要:
1 研究目的
在传统的中医教学模式中,师生面临着诸多挑战。一方面中医知识体系庞大复杂,学生学习时难以系统掌握,因师资有限,学生问题无法及时获得个性化解答;另一方面教师教学中也面临教学资源整合难、内容呈现不全面、一对多授课模式下难以针对学生具体情况提供个性化指导等问题,导致学生实际问题难解决。这些因素共同制约了教学效果的提升,难以满足学生日益多样化和个性化的学习需求。因此本文在构建中医课程知识图谱的基础上,针对现有的课程资源进行进一步整合,为中医教育领域打造一个专业性高、回答准确率高的问答系统,助师生更好地开展教学和学习活动。
2 研究内容和方法
2.1《各家针灸学说》课程知识图谱知识框架构建
通过文献调研研究了课程知识图谱中的关键实体及实体间的关系,为《各家针灸学说》知识图谱的构建提供借鉴,随后借鉴并改进了七步法最终形成了《各家针灸学说》知识图谱框架,为知识图谱的建立奠定基础。在智能问答系统中采用人工标注和大语言模型相结合的方式对课程中的实体、关系、属性进行标注和抽取。对抽取的知识进行人工审核和标准化处理,最终同步在图数据库Neo4j中。
为了进一步拓展课程知识,本文还充分考虑了《各家针灸学说》的前修、后修课程之间的关联和师生的需求,采集了针灸类医案、古籍、标准、1949-2022年针灸临床随机对照试验数据,将这些与课程相关的外部知识融入到智能问答系统中,这不仅丰富了课程知识的内容,也为问答系统提供了更为全面的数据支持。2.2 基于检索增强生成技术的智能问答系统研究
本文对基于检索增强生成技术的智能问答系统进行概述。先对智能问答系统和检索增强生成技术进行基本介绍,并说明目前基于大语言模型和检索增强生成问答的现状及不足,针对问答系统中数据类型上存在局限性的问题,本文尝试融合多种问答方式,将知识图谱、Elasticsearch加权打分和向量库检索与大语言模型(Large Language Model,LLM)结合,构建了一个基于检索增强生成技术的智能问答系统。
2.3 智能问答系统的设计与实现
本文分析了教育平台在课程资源的丰富度与针对性、问答答案的准确性和权威性及教学资源的系统性和组织性等方面仍存在诸多不足。针对这些问题,本文从智能问答系统的数据构成、数据格式、问答结果展示、教学反馈四个方面对系统进行了设计和开发。
3.研究结果
3.1 构建了《各家针灸学说》课程资源知识图谱
《各家针灸学说》知识框架中有19类实体,实体之间的关系有17种,确定了2种属性。在智能问答系统中经过知识抽取、人工校对和审核,纳入实体总数为5614个,属性总数为138个,关系总数为5783个,将数据同步于Neo4j图数据库中作为知识图谱数据源。其次对采集的830个针灸类医案进行标注和标准化,作为基于Elasticsearch加权打分的数据源。最后将下载的25个针灸类标准、30本古籍、2021-2022年9412篇针灸临床随机对照试验文本数据,合并课题组前期处理的的1949-2020年14708篇针灸临床随机对照试验文本数据,一起导入智能问答系统中,作为向量库检索的数据源。
3.2 完成了基于检索增强生成技术的智能问答系统的研究与评价
基于《各家针灸学说》课程资源,构建了一个基于检索增强生成技术的智能问答系统,该系统将知识图谱、基于Elasticsearch加权打分、向量库检索和大语言模型相结合,融合了三种问答方式各自的优势,在一定程度上弥补了其中一种方式和大语言模型结合的不足;该系统支持结构化数据、半结构化数据和非结构化数据的导入,弥补了问答系统中数据类型存在局限性的问题,且系统还能展示思考过程,可进行溯源,显著提升问答的可解释性。最后本文从主客观两个角度对智能问答系统进行评价,结果皆显示智能问答系统比其他大语言模型性能更好、专业程度更高、回答问题的准确率更高。
3.3 实现了智能问答系统的开发与应用
构建了一个能够实现课程内外知识拓展、丰富课程资源的智能问答系统。该系统支持结构化数据、半结构化数据和非结构化数据的导入,并能及时更新内容。为提高问答系统的准确性,系统设计了知识可溯源功能,方便师生查看答案所属的数据源,增强了问答系统的权威性和可信性。并邀请了中医院校的师生对智能问答系统进行试用和评价。结果显示,师生对智能问答系统的满意度较高,尤其认可系统回答的准确率和丰富的课程资源,认为其有利于教学。
4.研究结论
本文通过构建中医课程知识图谱和问答系统的设计与实现,研究了相关的理论、方法与技术,为中医教育领域知识图谱框架设计和智能问答系统的研究提供了有益的参考和借鉴。同时,该研究也为解决传统中医教学中面临的诸多问题,如教学资源分散、教学效率低下、学生学习困难等,提供了新的思路和方法。通过构建知识图谱和问答系统,可以更好地整合中医教育资源,提高教学效率和质