基于Naive Bayesian算法改进的智能诊病系统研究

来源 :现代经济信息 | 被引量 : 0次 | 上传用户:aixiaowen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文简述了智能诊病系统的发展,简单介绍了智能诊病系统,指出了它的一些局限性,并且介紹了Naive Bayesian算法的原理,提出了以该算法为基础的改进方案。
  关键词:智能诊病;人工智能;专家系统;知识库;推理机;Naive Bayesian算法
  中图分类号:TH165.3 文献识别码:A 文章编号:1001-828X(2017)009-0-01
  一、智能诊病系统的发展
  人工智能是现今最尖端的技术之一,近三十年来,人工智能发展迅速,在很多领域都得到了广泛的应用。专家系统是人工智能重要的一个分支,它通过一个或多个专家提供的专业领域知识,模拟人类专家解决那些需要专业领域知识才能完成的问题。1965年,美国斯坦福大学研制出了DENRAL系统,该系统具有丰富的化学知识,能帮助化学家推断出分子的结构。DENRAL系统的完成标志着专家系统的诞生。20世纪70年代初, NTERNIST系统在匹兹堡大学问世,这是第一个用于医疗的内科病诊断咨询系统。同一时期,一款能够帮助普通内科医生诊治细菌感染性疾病的专家系统MYCIN也在斯坦福大学出世,这两款专家系统的成功激发了智能诊病系统的开发热潮,国内外都开始往这方面投入大量的人力物力。到21世纪初,智能诊病系统已经相对成熟。
  二、智能诊病系统
  智能诊病系统以基于规则的方式来构建系统,它主要将系统分为知识库和推理机两部分,知识库中存储着各种医学知识的集合,包含从书本中知识,以及医学专家的知识和经验,而推理机根据用户提供的有效信息,来决定所使用的推理规则,通过从知识库中获取的相关知识进行推理判断,从而得出最终的结论。推理分为精确推理和不精确推理,精确推理根据条件和结论之间的必然性,得出的结果是肯定的,不精确推理:在条件不足的情况下,得到的假设不能被完全证实,这个时候为每个假设赋予一个权值来表明这个假设的可信度,通过这些假设进行下一步推理,可能会得到多个不同的结论,以可信度最高的结论作为最终结论。
  三、智能诊病系统的缺点
  难以得到足够知识和规则填充知识库,智能诊病系统做为基于规则的专家系统,需要以大量知识和医学专家规则作为基础,才能够准确地诊断病人的病情,这就需要大量的医学专家和知识工程师的参与才能够实现。
  缺乏学习能力,跟一般的基于规则的专家系统一样,智能诊病系统不具备从诊病过程中提取经验进行学习的能力,只会依循本来就存在的规则和知识进行推理判断,更新知识库,添加规则些工作仍然需要知识工程师来完成。
  Naive Bayesian算法:
  Na?ve Bayesian 算法能够较好地对事物进行分类,具有结构简单,计算高效等特点,是分类算法中最经典,最有影响力的算法之一。Na?ve Bayesian算法首先需要通过训练样本计算出先验概率,在此基础上,计算一个待分类的后验概率。下面是Na?ve Bayesian 算法的定义,对于一个待分类的事物x,设:
  1.x有{a1,a2,a3,……an}这样一个属性集,每个a都是x的一个特征属性。
  2.有{y1,y2,y3,……ym}这样一个类别集合,每个y代表一个类别。
  3.分别计算P(y1|x),P(y2|x),P(y3|x),…..,P(ym|x)的概率。
  4.如果有P(yi|x) >= P(yj|x)(j属于1~n),则事物x属于类型yk。
  在这里,我们称P(yi|x)为后验概率,根据贝叶斯定理,P(yi|x) = P(x|yi)P(yi)/p(x)。
  由于对于所有的后验概率,都需要除以P(x),所以在这里我们可以将P(x)忽略,只求出最大的P(x|yi)P(yi)即可。P(x|yi)P(yi) = P(a1|yi)P(a2|yi)P(a3|yi)…P(an|yi)P(yi),其中P(aj|yi)和P(yi)我们都需要通过样本数据进行计算:
  1.设有样本集{x1,x2,…xn},每个样本有一个属性集a其中包含若干属性。
  2.有{y1,y2,…ym}这样一个类别集合。
  3.P(yi)为样本中类别yi的个数/样本总数。
  4.P(aj|yi)为样本中类别yi中含有aj属性的个数/类别中yi的个数。
  通过Naive Bayesian算法对智能诊病系统的改进:
  由于知识库中知识量和规则的限制,智能诊病系统可能会出现无法准确判断用户病情的状况,通过Na?ve Bayesian算法可以有效地改善这一情况。一个人患病的原因会跟他平时的生活环境,生活习惯还有家族遗传有很大的关系,由此,我们可以将生活环境,生活习惯和家族遗传作为特征属性,建立一个辅助诊断病情的Navie Bayesian分类器。算法的训练样本通过记录每个精确推理确诊的患者的生活环境,生活习惯,家族遗传等属性信息取得,通过不断地增加训练样本,Navie Bayesian分类器的准确性不断提升,从而提升智能诊断系统的不精确推理能力。
  参考文献:
  [1]Liu H, Motoda H. Feature selection for knowledge discovery and data mining[M].Springer Science
其他文献
在“大众创业、万众创新”的时代背景下,初创企业遍地开花、多如牛毛.但对于创业者而言,创业初期就面临着企业股权结构设计这一大难题.在企业创建初期采取合理的设计股权结构
目的:观察危机管理模式在急诊外科护理安全管理中的应用效果,为急症外科护理安全管理方案选择提供参考.方法:选取2018年3月-2019年3月在我院急症外科收治的患者164例,随机分
中国经济依然寒风凛冽,工业增速跌破9%,投资继续低迷,出口接近零增长,中国经济步入了持续而缓慢的下行通道。  市场在极力寻找“寒风中的一丝暖意”——基建投资、房产投资有所反弹,国家发改委近日批复了近万亿元的投资项目,出口退税呼之欲出。这些到底是真正的雪中送炭,还是“画饼充饥”?  国家发改委批复的“万亿刺激计划”很可能只是新瓶装旧酒,并不具有新的刺激功能。哪怕这些项目都是新的投资,如果缺少银行的信
进入二十一世纪,市场竞争异常激烈,传统的供应链成本控制方法在新的经济形势下具有明显的缺陷,价值增值效率不明显,极大地影响了从业企业的发展。具体表现为:各个供应链的运
预算是企业计划管理的表现形式,是提高企业经营成效的有用工具,而预算管理又是企业管理的重要组成部分.但多数企业预算管理并不能达到预期效果,预算本身的不科学、不合理以及
目的:探讨针对性护理在钬激光碎石治疗伴有严重肾积水输尿管结石患者中的应用效果.方法:选取我院2018年3月-2019年3月期间收治的伴有严重肾积水输尿管结石患者60例为研究对象
网上银行在拓宽银行范围、提高金融效率的同时,也以其特殊的经营形式及风险特征,对传统的银行业监管提出了挑战.这些风险将会对本国经济、金融和社会安全带来巨大威胁,同时也
冀中能源(000937.SZ)的隐性债务人中出现了税务部门,债务超过1亿元。  借款?还是超收税费?  《证券市场周刊》记者调查发现,受经济增速放缓影响,地方财政收入大幅下降,为保年初财政收入计划,唯一途径便是通过强化税收来维持。繁重的税收任务最终落到了企业的头上,并且大部分税收的任务也都将由大企业来完成。  “吃大户”成了地方政府充盈财政的重要手段,税务部门通过调解增项来完成征收任务。当冀中能源
随着我国市场经济的飞速发展,各行各业的企业管理人员越来越重视审计的重要性。审计质量直接关系到审计工作的效果。为了保证企业的审计质量,企业内部的审计部门必须加强审计质
地沟油入药?已经不再是秘密。  全国首例特大地沟油案揭开了地沟油流入制药业的秘密,以健康元(600380.SH)为首的一批上市公司深陷其中,国家药监局、焦作市政府派出专案组调查此案。国家药监局新闻发言人王良兰表示,在调查结果出来之前,不会要求召回焦作健康元生产的7-ACA产品和下游企业利用7-ACA生产出来的头孢类抗生素。  7-ACA作为抗生素的三大母核之一,被广泛用于生产各类抗生素原料药。医药