2022年基于数据挖掘的疫病藏医用药规律研究.docx
《2022年基于数据挖掘的疫病藏医用药规律研究.docx》由会员分享,可在线阅读,更多相关《2022年基于数据挖掘的疫病藏医用药规律研究.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2022年基于数据挖掘的疫病藏医用药规律研究 肖宗朋刘鸿陈建英唐东明谭颖 目的:对治疗疫病的藏药用药规律进行挖掘,为COVID-19的藏药防治供应参考。方法:采纳频次分析、关联规则分析、聚类分析等数据挖掘方法来找寻藏医药的用药规律。结果:藏医治疗疫病以清热、化痰、消炎、活血、燥湿为主;药性多偏温,药味多偏甘、辛、苦,归经多入肺、胃经。结论:数据挖掘方法总结藏医治疗疫病的用药规律,以清热、凉血、活血、消炎、抑菌为主,亦有补血、滋阴的功效。 数据挖掘;频次分析;关联规则分析;聚类分析分析;COVID-19 R29 A 1007-8517(2022)04-0001-04 Abstract:Objec
2、tive It excavates the rules of Tibetan medicine medication for the treatment of epidemic diseases to provide reference for the prevention of Tibetan medicine of COVID-19. Methods Data mining methods such as frequency analysis, association rule analysis and Clustering analysis were used to analyze of
3、 the medical medicine rules. Results Tibetan medicine in the treatment of epidemics to heat, phlegm, anti-inflammatory, promoting blood circulation, dryness and dampness. The medicine has a warm effect and a sweet, astringent and bitter taste. Conclusion The data mining method summarized the rule of
4、 Tibetan medicine to epidemic diseases, it can be concluded that the treatment is mainly characterized by clearing heat, cooling blood, anti-inflammatory, promoting blood circulation and bacteriostasis, as well as the effect of enriching blood and nourishing Yin. Keywords:Data Mining;Frequency Analy
5、sis;Association Rule Analysis;Clustering Analysis 2022年12月,湖北省武漢市首次报告新型冠状病毒肺炎(COVID-19)病例,其主要传染源是感染人群和无症状患者,传播方式主要有三种干脆传播,接触传播和气溶胶传播1。COVID-19已作为急性呼吸道传染病被列入乙类传染病,根据甲类传染病管理。中医药及中西医结合策略在这次疫情的防治中发挥了主动的作用,在湖北省中医药救治参加率有着91.05%,而全国除湖北省以外的地区中医药参加救治的病例更是高达96.37%2。 藏医学在千百年的医学实践中针对传染性疾病积累了丰富的治疗阅历3。史料记载,吐蕃王朝第三
6、十代藏王仲时期若患麻风病,自愿做活葬,以绝其传染源4。自新冠肺炎疫情暴发以来,西藏、青海推广关于新冠肺炎运用藏医药防治的方案,取得良好的效果。由于藏药组方配伍的独特性,其复方成分往往多达数十味药材,本探讨运用数据挖掘技术找寻其中的核心处方,以期为藏医药治疗COVID-19供应有益的借鉴。 1 资料和方法 1.1 数据来源和录入 本探讨的数据主要来源于青海省2月25日颁布的青海省新型冠状病毒肺炎藏医药防治方案(试行其次版)5和西藏自治区藏医药管理局2月23日颁布的新型冠状病毒感染肺炎藏医药防治方案(试行其次版)6所载的方剂。进行方剂整理时,参考中国藏药材大全7、藏药方剂宝库8对其进行归类。选用E
7、xcel进行方剂和药材信息的基础录入。 1.2 数据分析 1.2.1 数据预处理与频数统计 Apriori算法是一种针对单维、单层、布尔关联规则的数据挖掘算法,挖掘关联规则时,只能处理分类型变量,并要求待处理的数据在存储时要以项集的方式存在,即事物表和事实表9两种。为保证后续数据挖掘工作能顺当开展,须要对待处理数据根据算法所需的数据要求进行预处理。如方剂清肺止咳丸配方中出现的“各适量”“各等量”“g”等词都删除,使非结构化数据转化为结构化数据。运用jieba算法对数据进行预处理,提取药物名,去除干扰因素的文字,然后运用collection中的Counter计数器来进行方剂中出现的药物频数统计。
8、 1.2.2 关联规则 关联规则主要反映数据集中数据项之间的关联性。在数据集中,若大量记录在具有特征属性A的同时,也频繁出现特征属性B,则称特征属性A和B构成频繁模式。挖掘频繁模式可以发觉数据中隐含的关联和相关性,即关联规则。 关联规则目前常用于传统医药领域,主要是从大量且困难的传统医药信息中发掘不同数据集之间潜在的联系,常见于方剂配伍规律的探讨。关联规则的爱好度由其支持度(support)和置信度(confidence)来度量,它们分别反映规则的有用性和确定性。在用药规律挖掘中,支持度是指全部药物组合中同时出现两味或者多味药材组合的概率;置信度则是在某一药材出现的条件下,另一药物出现的概率。
9、 Apriori算法是進行关联规则分析的经典算法,主要包含两个阶段:首先采纳逐层搜寻的迭代方法,从整理完毕的数据集中找出全部的频繁项集,即项集出现的次数满意预定义最小支持度阈值;随后从产生频繁项集中发觉满意条件的强关联规则,即这些规则必需同时满意最小支持度和最小置信度10。 1.2.3 聚类分析 不同的藏药之间有着各种各样的联系,通过聚类分析,可以从不同藏药中找出共同点。在本探讨中通过聚类分析法对高频药物进行归类,从而发掘不同藏药类群的主要特性。首先取出频数靠前的前12味药物,将每一味药物作为变量,每个药物作为个体进行药味和药性的统计,其中药物中有此特性记为1,没有则记为0。根据此方法完成高频
10、药物数据矩阵的整理后,运用SPSS Statistics 22.0软件进行聚类分析。 2 结果 2.1 主要藏药频次分析 通过对藏医用药的统计,得到藏药114味,其中运用频次较高的前12味藏药依次为诃子、红花、毛诃子、檀香、牛黄、木香、余甘子、天竺黄、宽筋藤、藏木香、麝香、沉香。这些高频数的藏医药运用的总构比占36.39%,详见表1。通过分析运用频率前12味药物的药味信息,辛味的出现频数最多。药性统计发觉,温性的频率最高,其次为凉性。归经统计发觉,以肺和肝最多,胃其次,结果见表2、3、4。 2.2 关联规则 通过jieba算法对相关数据进行预处理,除去了除药材名以外的干扰项,将处理后的数据导入
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 基于 数据 挖掘 疫病 藏医 用药 规律 研究
限制150内