-
基于中医传承辅助系统的治疗肺痈方剂组方规律分析
[摘要】基于中医传承辅助系统软件,中收载的治疗肺痈方剂组方规律。中主治肺痈的方剂,录入中医传承辅助系统,采用软件集成的改进互信息法、复杂系统熵聚类、无监督的熵层次聚类等无监督数据挖掘方法,分析肺痈方剂的组方规律。结果对筛选出的132个肺痈处方的分析,确定处方中药物出现的频次,演化得到核心组合46个、新处方8个。表明中医传承辅助系统可实现对方剂数据录入、管理、查询和分析,是一个有价值的中医药研究辅助工具。
[关键词】中医方剂大辞典肺痈;中医传承辅助系统;组方规律
方剂是中医临床治疗经验的有效载体,通过古代方剂的用药规律分析,对中医药学术继承与创新具有重要意义。本课题组既往采用改进的互信息法‘“、复杂系统熵聚类皿…、无监督的熵层次聚类…等无监督数据挖掘方法,应用于中药组方规律和处方发现。为了便于应用,集成以上算法,本课题组开发了中医传承辅助系统软件。该软件具体“数据录入-数据管理·数据查询傲据分析-网络可视化展示”等功能。该系统实现了临床病案信息、疾病信息、证候信息、中药信息、方剂信息等数据的管理、检索、分析等功能,可用于名老中医经验继承、临床医师个体经验总结、方剂组方规律分析及新药处方发现等领域。本文基于中医传承辅助系统对中治疗肺痈的方剂用药规律进行系统分析。
1资料与方法
1.2 处方筛选肺痈是肺叶生疮,形成脓疡的一种病证。临床以咳嗽,胸痛,发热,咳吐腥臭浊痰,甚则脓血相兼为主要特征。考虑中医其他疾病可能兼见肺痈疾病的临床症状。因此,本次在上述来源方剂中筛选“主治”或“功用”项中明确记载“肺痈”的方剂,并剔除其中组成重复的方剂。例如:《中医方剂大辞典》九册所载:“清肺饮【方源l《玉案》卷六。【组成】银柴胡玄参陈皮桔梗各一钱白茯苓地骨皮麦门冬薏苡仁人参甘草瓜萎仁各八分。【主治】肺痈。咳吐脓痰,胸膈胀痛,上气喘急,发热。”其中“主治”项中明确记载“肺痈”,故收载。通过筛选,收集明确治疗肺痈方剂共132首。
1.3 处方的录入与核对将上述筛选的方剂由专人录人中医传承辅助系统。考虑录入过程中可能出现的纰摒,在完成录人后,再由双人负责录入数据源的审核,以确保数据源的准确,而为数据挖掘结果的可靠性提供保障。
1.4 数据分析通过“中医传承辅助系统”中“数据分析”模块中“方剂分析”功能,进行组方规律分析。第一步在中医疾病查询项中查询“肺痈”,将治疗肺痈的方剂提取出来,如图1所示。
第二步药物频次统计,将方剂中每味药物的出现频次按照由大到小排序,并可以导出Excel文件。第三步组方分析,首先进行聚类分析(核心算法包括改进的互信息法、复杂系统熵聚类),在聚类分析前,选择合适的相关系数和惩罚系数;然后点击提取组合按钮,发现新方(核心算法是无监督的熵层次聚类)并可以实现网络可视化展示,如图2所示。
2结果
2.1用药频次《中医方剂大辞典》中治疗肺痈的132个方剂包含的226种药物,进行。频次统计”,可得到治疗肺痈药物频次从高到低的排序。使用频次在5以上的药物有50味,见表1。
2.2基于改进的互信息法的药物问关联度分析根据本次治疗肺痈方剂数量、结合经验判断和不同参数提取出数据的预读,选择相关系数(correlation)为10,惩罚系数(pena崎)为5,进行聚类分析。得到治疗肺痈方剂中226味中药之间两两之间的关联度,其中,将关联系数”剖在0 02以上42药对进行列表,见表2。
2.3基于复杂系统熵聚类的核心组合分析以改进的互信息法的分析结果为基础,按照相关系数与惩罚系数的约束,基于复杂系统熵聚类,演化出3—5味药的核心组合,共计46个,见表3。
2.4基于无监督的熵层次聚类的新处方分析在以上核心组合提取的基础上。点击系统中“提取组合”按钮,通过无监督的熵层次聚类算法,有16个核心组合,见表4;可以进一步聚类,得到8个新处方,见表5。
利用软件的“网络展示”功能,可采取不同网络可视化方式,直观展示出药物不同组合之间的关系,例如:图3—4
分别是表4中用于新方聚类的核心组合的网络可视化的不同展示方式。
基于熵层次聚类,表4中的核心组合再进一步组合,形成治疗肺痈的新方,结果见表5,网路可视化展示见图5
3讨论
既往分析方剂组方规律常常以用药频次为基础,该类方法适用于发现显性经验,难以有创新性发现与认识。本课题组多年来致力于采用改进的互信息法H1、复杂系统熵聚类悟“、无监督的熵层次聚类…等无监督数据挖掘方法,分别实现对药物之间关联性的定量描述、核心组合演化与提取、新处方发现等功能。所采用的方法强调相关性分析,可以提取低频次高相关的组合,更适合隐形经验的挖掘与发现。在算法优化与完善的基础上,本课题组开发出“中医传承辅助系统”软件,该软件界面友好、使用便捷、运算速度快,为中医学术传承提供了有益的工具。
本文采用“中医传承辅助系统”软件,录入《中医方剂大辞典》中收载的治疗肺痈的方剂,分析得到治疗肺痈方剂的药物使用频次,基于互信息法提取出的药对及关联系数,演化出46个核心组合,其中,16个核心组合进一步演化出8个新方,为临床或基础研究提供了有益的线索。但核心组合及新处方的临床价值尚需要通过溯源、临床医生的判读、临床试验的研究等进一步评判。
本课题组将在此软件的基础上,进一步优化软件的操作界面,丰富和优化数据挖掘方法,扩展分析功能,显示疾病、证候、四诊信息、药物之间的多维度关联分析。