论文部分内容阅读
中药是我国的国粹,经过上千年的发展,积累了大量的数据,以往对于这些数据的应用,仅仅是提供一些简单的搜索及统计功能,中医药数据中蕴涵的信息未得到很好的利用。随着世界性回归自然潮流的推进,天然药物的开发越来越受到人们的重视,这为中药的发展提供了一个很好的机遇。如何从包罗万象的中药数据库中发现有价值的信息,以增加中药的科技含量,已成了中药信息化研究的重点。 本文阐述了在中医药专利信息平台上实现知识发现系统的过程,主要包括了方剂信息数据预处理、发现配伍规律和辅助决策三个模块。 针对中药专利的数据特点,以PIDP(方剂信息数据预处理,Prescription Information’s Data Preprocessing)过程规范方剂数据:1、用正交分离的方法对方剂长文本字段进行处理,使方剂中的各味草药独立存储;2、利用中药词典,解决了目前普遍存在的中药异名问题;3、以模糊集描述实际药剂用量。 本文改进了T.P.Hong等提出的FTDA算法,并在此基础上提出FTDA2算法,该算法仅考察对支持度有贡献的项,有效降低了从方剂事务数据库中提取出关联规则的时间复杂度,从规范化方剂数据中提取中药配伍规律,组建模式/规则库。 在模式/规则库的基础之上,系统实现了辅助决策模块,成功地为医学研究人员在研制新型复方中药的过程中提供参考依据。 论文的创新之处在于: 1、本文提出的FTDA2算法,用于在含有数值属性的事务数据集中发现模糊关联规则。与已有算法FTDA相比,在计算k-项候选集时,两种算法的时间复杂度比值为:T(FTDA2)/T(FTDA)≈1/(2k),从而有效降低了时间复杂度。 2、针对系统对方剂长文本处理的需要,设计了符合中药方剂数据特征的PIDP过程,将原始的方剂数据规范化。对方剂长文本进行正交分离,并对不同的属性采用不同的策略:药名异名处理,药剂量模糊化处理。 3、将数据挖掘较为深入的应用到中药研发过程中,弥补现有中药信息系统功能单一的不足,为医学工作者进行决策提供参考。系统提供两大辅助功能:一