基于Web挖掘的中医知识发现研究

来源 :北京交通大学 | 被引量 : 5次 | 上传用户:wwtrust
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医是生命科学具备中国特色的传统组成部分,在2500多年的实践中,中医在疾病诊疗和方药使用上具有特色和显著的临床功效,并包含着丰富的知识,几千年的医学实践积累了大量的数据。Internet中含有丰富的医学信息资源,并且资源总量仍然在快速的增长,如何从海量的数据中提取有用的医学知识对中医药信息化建设和临床诊疗具有重要的意义。Web挖掘是解决上述问题的一种有效的方法,它借助数据挖掘的理论方法,从大量半结构化的Web文档集中发现潜在的、有价值的知识,近年来,已经成为一个重要的研究方向。本文以辅助中医信息化建设和临床诊疗研究为目标,采用网页分类和信息抽取技术,设计并实现了基于Web挖掘中医药知识发现系统。本文的主要研究内容包括:(1)对网页分类进行研究,针对中文网页的自动分类逐渐成为Web挖掘研究的热点,它的技术包括文本表示、权重计算、特征选择以及分类算法,本文采用基于字特征的文本特征表示在最大熵分类器上对网页进行分类,以获得和医学相关的网页。(2)命名实体识别是信息抽取中的关键技术,在信息检索、机器翻译、自动文摘等领域发挥着重要作用。本文介绍了三种基于统计的命名实体识别方法,讨论了条件随机场(CRF)模型相对于其他模型的特点。本文采用CRF方法在网页中进行疾病名称的提取。(3)基于Web挖掘的中医药知识发现系统关键模块的实现,包括网页数据采集模块、网页预处理模块、网页分类模块、医学术语识别模块和关系建立模块。
其他文献
相比较传统全文搜索引擎,垂直搜索引擎可以为用户提供更专业、更准确的知识,避免用户在大量的数据中筛选与专业相关的知识,是搜索引擎的研究热点和发展趋势。目前垂直搜索引
人脸分析是当前计算机视觉、模式识别和机器学习等领域的热门研究课题之一,得到了广泛的关注。人脸分析主要通过人脸图像来分析出人脸的各类信息,如:人脸身份、人脸表情、人脸
G蛋白偶联受体(G protein coupled receptors,简称GPCRs)是生物体内最大的跨膜蛋白超家族,通过与G蛋白偶联,GPCRs在细胞内外信号跨膜传导的过程中承担着重要角色。GPCRs也是药物
无线传感器网络在最近的研究中越来越热,基于无线传感器网络不同于其他网络的特点,因此针对无线传感网络提出的路由协议也在学术界备受关注,开发特定的无线传感器路由协议也
颅骨面貌复原是刑侦、考古等领域的研究热点和难点。本文提出了一种基于分区统计模型的颅骨面貌复原算法,可降低小样本问题带来的复原误差。将颅面模型按照生理结构划分为眼
Web服务组合是一种基于面向服务架构的技术,通过把功能单一的单个Web服务组合起来,实现了服务的重用与增值,解决了互联网异构应用的集成和协作问题。Web服务组合的特点包括松
随着IC工艺水平不断发展,智能卡处理能力不断增强,存储空间不断增大,使得卡上可以存储越来越多的信息,因此有必要在传统智能卡平台中引入数据管理,从而能够利用卡上资源,灵活
传统的SNMP协议至今仍被大部分网络管理系统所使用。然而随着网络技术的不断发展,网络变得越来越复杂,规模越来越大,网络设备所包含的信息也越来越多,SNMP协议的弊端逐渐显露
在当今计算机信息领域中,网络的迅猛发展和普及在很多方面都给人们带来了巨大变化,对学校的教育模式也产生了深远影响。本世纪伊始,放眼全球,很多国家和地区都加大了对信息化
随着科学的进步和技术的发展,科学工作流的计算规模日益增大,计算流程日益复杂,将工作流放在云环境中,利用云平台强大的计算能力和存储能力加速工作流的执行已成为当今提高工作流