论文部分内容阅读
随着数据挖掘技术的蓬勃发展,数据挖掘在各个领域都大放异彩。在医疗领域中应用数据挖掘技术进行疾病预测更是已经成为当前研究的热点。同时医院在为患者提供医疗服务的过程中积累了海量的、有价值的临床数据资源,越来越多的临床数据被存储在医疗数据库中,如何从大量的无规则的临床数据中发现有价值的信息,为今后的疾病诊断和医学研究做出贡献,成为大数据时代的热点问题。深度学习技术是机器学习领域中最新研究成果,论文尝试将深度学习技术应用到甲状腺结节良恶性的预测。本论文通过对上海市某大型综合性三甲医院的甲状腺结节超声数据进行数据挖掘,建立基于深度学习的预测模型以及设计与实现甲状腺结节良恶性预测系统。论文完成的主要工作如下:(1)甲状腺结节诊断多维分析。多维分析及可视化主要为了深入探索研究数据的内在规律和特点,希望借助多维分析方法对甲状腺结节患者进行分析,并将结果以图形化的方式直观地展现出来。(2)建立基于深度置信网络(DBN)的甲状腺结节良恶性预测模型。首先由于甲状腺结节超声数据是以医生诊断的形式获取的,主要由文本数据构成的。所以需要在建立模型前要对数据进行预处理。预处理主要是进行文本结构化、数据清洗、数值化以及归一化。然后构建甲状腺结节良恶性预测模型。结合甲状腺结节超声数据的特点,构建基于DBN的甲状腺结节良恶性预测模型。该模型的训练核心包括受限玻尔兹曼机网络(RBM)和BP(Back Propagation)神经网络,采用逐层贪婪学习算法进行训练,通过多次对比实验确定最优的网络结构,建立预测准确度更高的甲状腺结节良恶性预测模型。(3)设计并实现甲状腺结节良恶性预测系统原型。结合论文构建出的DBN模型,设计并实现了甲状腺结节良恶性预测系统原型。该系统主要包括四个模块:数据的预处理模块、多维分析模块、预测模型模块、预测结果展示模块,为甲状腺结节良恶性的判定提供了一种预测方法。