数据挖掘模型的创建及其在中医药文献中的应用研究

被引量 : 0次 | 上传用户:brettymate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
五千年中华民族的文化底蕴是中医药发生、发展的基础。中医药领域的无数临床实践与理论研究积累了大量的科学知识,这些知识包含在中医药古籍文献以及当前的研究文献中。面对如此海量的中医药数据,如何有效地利用这些宝贵资源就成了发展中医药必须面对的一个问题。中医药学有其自身的思维模式,具有系统性、整体性、复杂性、不确定性等特点,不适宜运用传统的还原论的方法研究。数据挖掘可以从海量的数据中寻找潜在的规律,完成普通人不能完成的任务。目前,数据挖掘相关技术和方法已经较为成熟,且存在着一套行之有效的方法。因此,应用数据挖掘技术进行有效模式、知识的获取研究,必将加速推进中医药国际化、现代化、规范化和知识化进程,对中医药学的长期稳定发展具有重要意义。数据挖掘(DM)是近20年来随着人工智能和数据库技术发展起来的,是一门涉及人工智能与数据库、统计学、机器学习等不同学科和领域的交叉学科。本文中数据挖掘采用广义观点,即等同于KDD,为从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有趣知识的过程。面对中医药数据描述多样化且不完备等现象,在标准化处理的同时,还必须对现有的数据挖掘技术进行改进和发展。本文以KDD方法为基础,创建了一种人机互动的数据挖掘模型。人工作业仅为编排及指定,最小化人为建档的工作量,并留下原始文本数据的换行断词噪声,作为操作标的,分析其产生结果。本程序可直接由文本数据作为处理标的。值得注意的是,基本辨认语料库必须正确,方有正确的结论。而数据资料的标准化则是可做可不做,重点在于我们对结论精度范围的要求。将此模型应用于选定的中医药文献资料进行挖掘研究,结果表明:(1)可以按照中医学理、法、方、药顺序做出标示及索引,能够揭示六名医家常用的相同或相似药物。(2)通过对《傅青主女科》方药规律的数据挖掘,发现当归、人参、川芎、酒、白芍、茯苓等药物及其配伍药对、药团最为常用,生化汤使用频率最高,提示补血调血及补气健脾的重要性。其中,对酒的普遍运用非常例外,这在之前的文献研究中很少述及。(3)通过对487首治噎膈病方剂的较为深入地研究,发现理气药所占频次最高,陈皮、木香、甘草、肉桂、人参等药物及其配伍药对或药团最为常用,而对于温里药及诃子的重视与现代临床用药有较大差异。还有,在剂型方面多选用散剂和丸剂,寓缓消渐散之意;在服法方面多选用不拘时候、内服、噙服,意在延长了药物与病灶局部的接触时间以提高药效。
其他文献
《义务教育国家数学课程标准》修定组组长、东北师大校长史宁中教授在课标修订过程中提出了“数学教学的四基”。其中,新增加的“数学基本活动经验”引起了数学教育界的广泛
目的:研究不同程度腹内高压对大鼠肠黏膜屏障功能的影响及可能机制.方法:将45只成年♂SD大鼠随机分为对照组、腹内压10和20 mmHg组,每组15只.运用氮气气腹法制作大鼠腹内高压
危重症患者由于存在气管插管/机械通气、鼻饲/肠内营养等诊疗操作加之存在程度不等的意识障碍,长期卧床,腹内压升高等高危因素,使胃食管反流十分常见,其危害性不但引起胃食管
原棉中的异纤长久以来一直是纺织工业高度关注的一个问题。传统上,纺织企业采用人工拣杂的检测去除方法,工作环境恶劣,劳动强度大,效率低下,且拣杂质量很难保证。因此,异纤在
<正>如果不是亲身体验,永远不知道丝绸有如此的美,如此的让人陶醉由于凯丽中国优秀丝绸品牌联盟店开幕,本刊记者再次走进凯丽丝绸友谊店。刚刚进入门口便被眼前现代、极简、
期刊
布匹疵点检测是纺织行业生产和质量管理的重要环节之一,目前人工检测速度慢,劳动强度大,受主观因素的影响,缺乏一致性和可靠性。计算机视觉技术随着大规模集成电路和图像处理技术
采用LM5010A芯片,设计了在高输入/输出电压比场合下应用的LED驱动电路,其驱动、控制、调光方式分别采用更具优势的恒流驱动、恒定导通时间(COT)控制和PWM调光方式。实验证明,
平衡能力是人体活动的基本能力之一,然而,它又几乎与所有运动项目有关。要求平衡木动作的稳定性是平衡木项目的特有属性。平衡木竞赛中的成功与失败往往与运动员的注意力息息
阐述了国内近几年来中速加弹机的发展,对新型中速加弹机的关键部分改进作了介绍。
目的将人白介素-18(human interleukin 18,hIL18)基因与表皮生长因子受体干扰序列(EGF loop C sequence,EGF)构建IL18-EGF融合基因,利用pET32a/E.coli BL21(DE3)表达IL18-EGF融合基