基于大数据技术的中药饮片外观性状与内在成分数据的研究与应用.docx
《基于大数据技术的中药饮片外观性状与内在成分数据的研究与应用.docx》由会员分享,可在线阅读,更多相关《基于大数据技术的中药饮片外观性状与内在成分数据的研究与应用.docx(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于大数据技术的中药饮片外观性状与内在成分数据的研究与应用 摘 要 目的:探讨大数据技术在中药饮片外观性状与内在成分数据结合分析中的应用。方法:总结现有中药饮片鉴别中外观性状与内在成分检测技术的不足,就中药饮片“内外结合”大数据库的探讨现状与应用前景进行综述。结果与结论:现有的智能感观技术存在数据不完整、不精确和对多维数据缺乏整合的不足,内在成分检测方法也存在诸多不足。大数据分析流程包括前期数据采集、数据预处理、数据分析与处理、数据可视化处理以及数据应用几个阶段。收集中药饮片形、色、气、味外在性状与内在成分数据以及文献学问库信息,构建中药饮片“内外结合”大数据库,再依据大数据处理流程与算法,可
2、实现人工智能协助中药饮片真伪优劣鉴别,实现对中药产地的辨别区分,挖掘影响中药饮片质量的因素,为其质量限制供应规范化标准。大数据技术的应用能精确、高效地处理中药饮片“内外”多维数据,可为传统中药行业探讨供应新思路,为中药饮片客观化发展供应新动力。 关键词 大数据技术;中药饮片;外观性状;内在成分 中图分类号 R282.5 文献标记码 A 文章编号 1011-040816-2287-04 传统中药鉴别包括基源鉴定、显微鉴定、性状鉴定与理化鉴定4种方法。针对中药的形、色、气、味的外观性状鉴定是对中药质量进行评价的重要指标,从其外观性状可以推断其原生植物品种、生长年限、品质等。然而,目前对于中药外观性
3、状的评价仍通过肉眼视察、口尝、鼻闻等方法来进行,不行避开地会因一些主观因素对鉴定结果的客观性与牢靠性产生影响。基于这种状况,许多学者提出通过机器视觉、电子鼻、电子舌等现代技术对中药饮片的形、色、气、味等性状信息进行量化,客观化表达人工鉴别的主观阅历,用以鉴别中药饮片1。当下大数据技术发展快速,且已广泛应用于农业、医疗、教化、能源、国防、金融等诸多领域。引入大数据技术对中药饮片数据采集过程中积累形成的大量外观性状数据与内在成分数据结合起来进行分析,建立其品质与外在信息间的耦合关系,可对中药饮片智能识别分类、产地智能分析推断的实现及中药质量标准的建立供应理论依据。 1 现有技术方法存在的不足 1.
4、1 智能感官技术的不足 1.1.1 数据缺乏完整性与精确性 已有探讨证明,中药材的形、色、气、味与其内在成分含量具有肯定关联度,但是对其形、色、气、味对应的物质基础探讨较少1,因此采纳智能感官技术进行鉴定缺乏与中药材或饮片内在成分的关联,影响数据采集的完整性。智能感官技术,例如电子鼻、电子舌等,由于仪器自身限制或传感器限制,对中药材的敏感度有限,尤其对辨识度不高的中药材检测正确率较低2,导致人们对其品质评判结果不能完全信任,从而极大地影响了人们的决策。 1.1.2 对多维数据缺乏整合 目前,智能感官技术在中药性状鉴别中的应用也越来越广泛,但大多数探讨人员往往只依靠一两种技术对中药饮片的性状进行
5、判定,多种分析技术的综合应用较少3-6,因此分析结果缺乏普适性,且各项技术得到的数据比较孤立,导致鉴别数据“各自为政”的现状,积累的大量数据分布在各自的“信息孤岛”中,未能得到整合与全面分析。而运用薄层色谱、液相色谱、质谱等多种方法用于內在成分的测定,获得的数据具有肯定的困难度,与外观性状数据的相关性探讨较少,因此对多维数据的集群整合及数据分析存在肯定的难度。 1.2 内在成分检测方法的不足 理化鉴别中一般采纳光谱、色谱、差热分析等技术,即利用中药分子内部一些含氢基团振动的倍频和合频汲取来实现对中药的快速鉴别,但其检测结果多为定性判定,精确度有所欠缺;且在实际操作过程中,针对样本的测量须要大量
6、有代表性且化学值已知的样品建立模型,在这样的状况下采纳上述技术对小批量样品进行分析就显得不太实际。此外,由于仪器状态变更或标准样品发生改变,所建模型也须要不断更新,其稳定性与适用性均难以估值,加之在试验过程中所用模型并不是通用的,每台仪器的模型都不相同,又增加了运用的局限性。 2 中药饮片“内外结合”大数据库的构建 2.1 大数据处理流程简介 大数据处理流程包括前期数据采集、数据预处理、数据处理与分析、数据可视化处理以及数据应用几个阶段,即通过对多来源数据进行整合,结合计算机学习算法对数据进行分析预料,可得出用于展示沟通的可视化图像或图形7-8,进而进行应用,详见图1。 2.2 中药饮片“内外
7、”数据采集 中药饮片“内外”数据是指外中药饮片外观性状数据与内在成分数据,可利用多个数据来源渠道进行采集,例如,运用电子鼻、电子舌等设备可对中药材及饮片的形、色、气、味等外观性状数据进行实时采集;运用色谱、光谱、电泳、差热分析等技术可确定中药材及饮片的内在成分数据;还可检索现有文献学问库中涉及到的相应中药饮片的数据记录等。分析各类数据集合的关联度,可构建中药饮片“内外结合”大数据库,对全部结构化与非结构化的数据进行存储与管理,以便后续数据的查询与处理。 2.3 数据预处理、处理与分析 由于不同来源的数据相互间易受到数据干扰产生噪声,存在数据值缺失、数据错误等问题9,因此须要对采集到的大量数据集
8、合进行预处理工作,以便为后续数据处理与分析阶段供应精确、无误、真实、有效的数据,提高数据的整体质量,保证结果预料的精确性与可行性。详细操作包括数据清理、数据集成、数据规约等。数据清理是指对于中药饮片的外观形、色、气、味数据与内在成分含量数据及文献库提及的全部数据进行数据清理操作,包括数据过滤与修正10-12和数据的不一样性检测等。数据集成则是将不同来源的数据进行集成,形成统一的数据库,以提高数据的完整性和可用性13-15。数据规约用在中药饮片外观形、色、气、味数据与内在成分含量数据处理中如:运用主成分分析法进行数据降维,提取数据主要特征向量,旨在运用少数向量反映原始数据的特征,提高数据的价值密
9、度,以降低数据集规模。 数据分析是大数据处理与应用的关键环节,确定了大数据集合的价值性和可用性,以及分析预料结果的精确性。在数据分析环节,依据大数据应用情境与决策需求选择合适的数据分析技术,可提高大数据分析结果的可用性。 2.4 数据应用 2.4.1 人工智能协助中药饮片真伪优劣鉴别 中药饮片的质量鉴定是对中药饮片真伪优劣的检验,而通过数据挖掘技术对中药饮片“内外结合”大数据库进行处理分析,结合神经网络深度学习算法,即可实现对其“真伪优劣”的鉴别。如熏硫、炒制等传统中药炮制工艺16-17,对一些含糖量高但不易贮存的中药饮片的运用和贮存均有肯定的主动作用。而以炒制为例,不同炒制程度的中药饮片具有
10、不同的临床疗效,炒制温度过低或过高都会影响有效成分的活性18,因此推断相宜的炒制程度就显得至关重要。有探讨获得不同炒制程度下的山楂“L*a*b*”颜色空间三维数值,其中L表示照度,a表示颜色从深绿色到灰色再到亮粉红色,b表示颜色从亮蓝色到灰色再到黄色。将颜色数值与内在含量改变数据进行归一化整合,应用PCA法降维,依据人工神经网络要求预设模型参数与反馈函数,确定最优权值与输出,建立外在性状-内在成分-炒制温度的算法模型。以“性状”数据作为ANN输入自变量,不同炒制程度下内在成分的改变设为因变量,结果该模型对3种不同炒制程度山楂的预料精确度分别为101.9%、92.5%、101.3%,得出山楂最合
11、适的炒制温度为;采纳PCA法对上述预料结果进行验证,结果得PC1=94.237%,PC2=4.533%,PC3=0.693%19-20。可见,该算法模型对不同炒制程度下的山楂具有很好的预料性能,可实现对炮制火候的限制检测30,详细预料流程见图3。 2.4.2 对中药材产地进行分析推断 道地药材是指在特定的自然条件和生态环境的区域内所产的中药材,其生产较为集中,具有特定的栽培技术和采收加工方法,质优效佳。鉴于不同产地的中药材其功效可能有所差别,因此采纳合理的检测技术,并结合有效的分析方法来辨别中药材产地显得尤为重要。 基于大数据的中药材产地判别,指在现有中药材产地数据之上进行各种算法的计算21,
12、如机器学习算法K均值、支持向量机算法、深度学习算法等22-25,形成不同算法模型,挖掘大数据集合中的数据关联性,从而得到中药材产地预料结果。陶梦琳等26收集多产地黄连样本,采集“内外”数据,建立了基于SVM算法的黄连饮片产地区分模型,实现了产地的区分,可用于分析同种药材不同产地的差异。Yang SL等27采纳试验室自助研发的机器视觉系统和AlphaMos公司研发的电子鼻、电子舌,分别获得贝母样品的“L*a*b*”颜色数值、18维气味特征值与7维味道特征值;采纳PCA法对多维数据进行降维处理,采纳SVM算法將不同产地贝母作为输出变量,建立多层数学分析模型,用于推断贝母饮片的不同产地。该算法通过强
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 技术 中药饮片 外观 性状 内在 成分 研究 应用
限制150内