基于监督式机器学习的疾病智能诊断算法研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:sunwen_fly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,使用传统的方法对疾病进行诊断时,诊断精确度从因人而异,并且受主观因素的影响较大。为了提高整体医疗水平,机器学习已经被引入到医疗诊断。机器学习在医疗领域的应用具有巨大的潜力,能够帮助医生和研究人员从数据集中发现规律,从而提高医疗诊断的效率和提高医疗服务质量。目前机器学习在医疗诊断领域发展迅速,提高了医疗工作人员的诊断效率,一定程度上改善了整体的医疗诊断水平。论文主要研究了单一疾病和多种疾病的智能诊断方法。当数据的正样本属性和负样本属性特征相似时,大多数机器学习算法通常无法在诊断单一疾病时正确分类数据。本文提出了一种基于置信区间的神经网络算法,可以很好地克服上述缺点。首先,所提出的算法对训练样本进行归一化操作,其次是用主成分分析(PCA)来减小维数以获得最优特征,然后使用反向传播(BP)来训练特征以获得诊断模型。在利用诊断模型对预测样本进行预测前,我们首先获得训练样本输出值分布的置信区间,然后根据预测值所属的置信区间确定最终预测结果。我们用基于加州大学欧文分校(UCI)数据库中的疾病数据集的算法进行单一疾病的智能诊断,并与其他经典的机器学习算法进行比较,如决策树,支持向量机,随机森林,K最近邻等。结果表明,该算法的预测精度明显优于其他现有算法。在多疾病诊断中,存在大量可以使用却没有得到有效整理的医疗诊断数据,如各大医疗网站的疾病信息数据,以及各个医院的诊断案例数据。在不侵犯隐私的前提下,可以通过利用知识图谱,对这些数据的分析,来达到进行疾病的智能诊断分析。本文基于知识图谱,对可以搜寻到的医疗数据进行整合。通过对朴素贝叶斯算法进行属性特征加权改进,提出了属性对类别的区分程度的量化方法,并将其应用在朴素贝叶斯的条件概率估计中。通过对用户输入的症状,进行疾病分析,并给出相应的可能的疾病概率。最后,本文在自行抓取并构建的数据集上对上述方法进行了验证,并给出了系统的实现过程。在以后的工作中,将重点提高单一诊断疾病算法的稳定性,在改进的朴素贝叶斯算法上,优化属性症状和疾病类别的关系权值,进一步提高诊断准确率。
其他文献
本文以神华集团为例,从资源采掘型企业经营特点和决定企业收益的主要因素入手,分析了神华集团经营战略的形成过程和经营模式,并根据神华集团发展规划及其经营战略中面临的问
触发器是VFP为应用程序开发人员提供的一种保证数据库中数据完整性的一种方法本文介绍了VFP中触发器的概念及创建方法,并给出了触发器在控制数据完整性方面的应用实例。
课程体系的构建决定了一个专业的知识体系构成。铁路类高职院校由于其办学的历史使命,其所开设的物流专业需要具有显著的行业特点。本文采用提出问题、分析问题、解决问题的研
一、移动通信技术具有覆盖面广、成本低廉,普及率高等众多优点,是目前农村信息入户的最佳途径我国农村地域广阔、地理环境复杂、通信基础设施落后,农村信息化存在网络使用成本高
目的:研究中学生伤害发生现状并分析其影响因素,为开展健康教育以及预防提供科学依据。方法:采取多阶段抽样法选取徐州市某县3所中学572名中学生,问卷调查学生伤害及其他相关情
本文研究了李雅庄煤矿石炭系太原组14、15号煤层开采后对煤系上覆K2、K3、K4灰岩含水层的疏干范围。通过冒落带、导水裂隙带高度计算,判断煤层开采后对上覆K2、K3、K4灰岩含