论文部分内容阅读
背景:道地药材是指品质好、疗效佳、来源于特定产区的优质中药材。道地药材除了其自身优良的品种以外,主要得益于道地产区特殊的地理气候环境。道地产区的环境因素是道地药材赖以生存的关键条件之一,主要包括温度、相对湿度、降水量、土壤等。目前,道地药材产区环境的变化、道地药材需求量的增加以及珍稀濒危药材的紧缺等问题,是道地药材亟待解决的问题。同时,若是引进新的品种,则新品种的引进效果也尚未可知。此外,中药材的种植主要是由中药种植基地和药农根据当地已有的品种以及市场的需求来决定,对于中药材的种植品质无法保证。药性是中药的内在属性,同时也是中药发挥治疗疾病作用的特有性质,中药药性理论是中药理论的核心内容。中药药性包括四气、五味、归经等,是中医指导临床用药的主要依据。中药药性通过四气、五味、归经等药性作为一个整体体现出一定的用药规律。有相关研究表明,中药药性与生长环境之间存在着一定的联系,药性的形成在一定程度上受外部生长环境的影响,从而导致不同产地中药在药性上表现出一定的差异。因此,本文将四气、五味、归经作为药性组合来研究道地药材药性与生长环境之间的关系。本文对道地药材药性与环境因素之间关系的研究,有助于依据环境因素科学指导中药种植基地和药农种植道地药材,保证中药质量的稳定。同时,进一步揭示道地药材药性的分布规律,探索中药药性的形成规律,有助于中药药性理论的发展和应用。构建道地药材药性组合预测模型,是一种高效研究道地药材种类、环境因素与药性之间关系的方法。通过对道地产区环境因素与道地药材药性之间关系的研究,建立道地药材药性组合预测模型,基于环境因素的差异预测各地区适合种植的道地药材种类,对提高道地药材产量、保证中药质量以及各地区引进新品种具有借鉴作用。同时,通过预测模型进一步总结不同环境状况下道地药材药性组合的特征。目的:本文研究道地药材药性与环境因素之间的关系,旨在构建道地药材药性组合预测模型,指导道地药材的合理种植以及提高道地药材的品质。此外,建立道地药材药性组合预测模型和道地药材药性全国分布图,以期得出不同环境因素下道地药材的药性组合特征,为揭示中药的用药规律、指导中医临床用药提供依据。方法:本文主要通过以下五个方面进行研究:(1)以完整性、准确性作为标准,通过集成中国气象数据网、土壤科学数据库、《中华道地药材》系列丛书、《中国中药资源丛书系列—中国中药区划》、网络数据库以及全国各省县县志的数据集,利用实体语法系统构建道地药材药性与环境因素之间的数据库。(2)对数据集进行数据预处理,包括数据清洗、缺失值的处理、整合数据以及数据标准化处理。数据的清洗是指清除重复样本,对于不符合条件的数据进行清除。缺失值处理是指将数据中缺失值进行删除。整合数据是指将相关属性的数据进行合并处理。数据标准化处理是指将数据集中不同类别的数据转化成统一标准化的数据。(3)道地药材药性分布的研究分析。首先从数据库中选取所需属性的数据,采用统计分析方法对随机两地区道地药材药性的差异性进行分析,计算其卡方值,以卡方检验分析中P值作为评价标准。当P值<0.05时,则代表两地区之间药性差异具有统计学意义。通过各地区之间道地药材具有的不同药性,绘制道地药材药性在全国的地形分布图,进一步阐明不同环境条件下的各地区之间道地药材药性分布具有一定的差异性。(4)道地药材药性组合特征预测模型的构建。数据集采用信息增益特征评价算法(InfoGainAttributeEval)和Ranker搜索方法在十折交叉验证的基础上进行属性筛选,将得分最低的两类进行删除,剩余属性的数据集参与预测模型的构建。将数据集按4:1的比例随机划分为训练集和测试集,将训练集用于构建模型,测试集对预测模型的性能进行检验。以决策树算法、贝叶斯网络算法和集成学习算法分别对训练集进行建模,通过预测模型的评估方法对三种分类预测模型进行对比,选取最优模型。(5)基于构建的最优模型建立道地药材药性组合分析平台。将已知真实值的数据集在道地药材药性组合分析平台上进行分析,通过真实值与预测值之间的差距,得出预测值的准确度,验证预测模型的可靠性。结果:本文的研究结果主要有以下四个方面:(1)构建道地药材药性与环境因素之间的数据库。(2)基于卡方检验对比两地区之间道地药材药性的差异性,通过对比随机选取的两地区药性四气之间的差异性,河北省和河南省的道地药材药性四气,其P=0.042<0.05,表明河北省和河南省这两个省份之间,其药性四气之间存在显著性差异;对比云南省和浙江省之间道地药材药性四气,其P=0.011<0.05,说明云南省和浙江省这两个省份之间,其药性四气存在显著性差异;对比湖北省和湖南省这组数据中,P=0.018<0.05,则表明湖北省和湖南省两个省份之间,其药性四气存在显著性差异。在研究广西壮族自治区和辽宁省以及山东省和维吾尔自治区这两组数据时,发现其P值均大于0.05,故两地区之间药性四气其差异无统计学意义。在分析道地药材五味药性在随机两地区之间的差异性时,通过各地区P值可以看出,没有P<0.05的值,即每组地区之间其五味药性差异无统计学意义。(3)分别利用决策树算法、贝叶斯网络算法以及Random Subspace算法构建道地药材药性组合预测模型,采用预测模型评价指标对模型性能进行评估。决策树算法构建的道地药材药性组合预测模型,其训练集和测试集对于构建模型的准确度相似,分别为73.67%和71.77%,Kappa统计结果均大于0.7,MAE值均为0.0027,RMSE值均在0.03左右。贝叶斯网络算法构建的道地药材药性组合特征预测模型,其训练集和测试集模型准确度均低于70%,Kappa统计结果均低于0.7,MAE结果均在0.003左右,RMSE结果均在0.048左右。Random Subspace算法构建道地药材药性组合特征预测模型,训练集和测试集模型准确度分别为73.52%和72.38%,Kappa统计的训练集和测试集结果分别为0.73和0.72,MAE的结果分别为0.0033和0.0032,RMSE值分别为0.038和0.038。通过以上分析,选取最优模型。(4)采用(3)中选取的最优模型,建立道地药材药性组合分析平台,并通过数据集验证预测模型的性能,计算其准确率。结论:本文通过研究道地药材药性与环境因素之间的关系,建立了道地药材环境因素与药性之间的数据库、构建道地药材药性组合预测模型。通过验证表明构建的预测模型可靠。基于最优预测模型,建立了道地药材药性组合分析平台。通过验证分析平台预测结果的准确率,证明道地药材药性组合分析平台具有一定的可靠性。总的来说,本文通过对道地药材药性与环境因素之间关系的研究为道地药材的合理种植提供了方法,同时也为不同环境条件下药性组合的研究提供了策略,有助于揭示中药的用药规律以及药性理论的补充和完善。