关键词:
肿瘤
登记
软件
R语言包
中国
摘要:
目的开发一款适合中国肿瘤登记的数据特点,并能满足常规统计分析功能需求的工具软件,以提高中国肿瘤登记的数据分析效率和质量,推动肿瘤登记数据的科学利用。方法通过问卷调查和面对面访谈获取中国肿瘤登记工作人员的统计分析功能需求。基于R语言的S3类泛函数概念开发相关函数功能,为不同的数据类型定义对应的S3类,从而实现相同函数在不同S3类数据上的功能多样化。功能函数的开发采用逐层构建的策略,确保各模块之间逻辑清晰,并遵循R语言包开发规范对所有函数进行系统测试与验证。结果开发了数据读取、数据操作、数据处理、统计计算、可视化和统计报告等6类函数,以实现中国肿瘤登记常规统计分析功能。数据读取函数支持读取全国肿瘤登记中心要求上报的数据格式。数据操作函数对登记处数据进行条件筛选,按登记处的属性(如城乡类型等)对数据进行重组、合并或转换,以适应不同的分析需求。数据处理函数实现包括年龄分组、国际疾病分类(第10版)、儿童肿瘤分类及人口数估计等功能。统计计算函数实现包括计算年龄标化率、截缩率、累积率、累积风险、寿命表以及将简略寿命表扩展为完全寿命表等功能。可视化函数可以绘制人口金字塔图、条形图、线图等肿瘤登记常用统计图形。统计报告函数则把统计指标、图表以及文字描述整合为综合的肿瘤登记报告。结论基于S3类泛函数的概念,开发了一款名为canregtools的R语言工具包。该工具包通过规范化的数据处理流程,能够满足多样化的肿瘤登记数据分析、可视化以及报告生成的需求,并且该工具包免费、开源,为提高中国肿瘤登记常规统计工作的效率和质量提供了有力支持。