【摘 要】
:
癌症已成为当今社会威胁人类身体健康的一个不可忽视的问题。传统的癌症诊断方式通常采用细胞形态学,组织病理学等方式。随着机器学习技术在计算机视觉,自然语言处理和语音识
论文部分内容阅读
癌症已成为当今社会威胁人类身体健康的一个不可忽视的问题。传统的癌症诊断方式通常采用细胞形态学,组织病理学等方式。随着机器学习技术在计算机视觉,自然语言处理和语音识别等方面都取得了不错的应用效果,利用机器学习技术对癌症进行预测成为了一种新的可操作方式。根据癌症检测的主要内容,本文将机器学习技术应用于智能医疗领域,分别针对癌症易感性,癌症幸存性与癌症复发性构建模型,辅助医生进行诊断决策。本文的主要研究内容和主要贡献如下:(1)对宫颈癌易感性问题进行研究。针对宫颈癌诊断中存在的类别不平衡问题以及过滤无效特征的问题,本文从数据分布、模型精度和特征数量角度出发,提出了一种结合粒子群算法与合成少数类过采样算法的方法。以此方法与多种机器学习模型对宫颈癌易感性进行研究,旨在解决数据集中的类别不平衡以及过滤无效特征的问题。其中本文所用的合成少数类过采样算法能够较好的模拟数据分布,粒子群算法不仅考虑了模型精度,而且兼顾了特征数量自动选取问题,相比较于传统模型采用的递归特征消除方法和主成分分析方法,该方法避免了手动设置特征数量的缺点。实验表明,该方法优于传统方法并能有效提高模型性能。(2)对肺癌幸存性问题进行研究。针对肺癌患者的一年幸存率问题,本文提出了一种结合粒子群算法与LightGBM模型的分类模型,面对高维复杂的肺癌数据,避免了人工选择特征。另外本文采用了遗传算法作为对照,使用了多种机器学习模型进行建模,对每种机器学习模型的表现进行了对比。相比于随机森林,支持向量机,神经网络等模型,LightGBM与粒子群算法相结合的分类模型提高了肺癌患者幸存时间的分类准确率。(3)对乳腺癌复发性问题进行研究。首先使用多种机器学习算法分别构建了乳腺癌复发预测模型,并使用堆叠网络对模型进行集成。之后使用改进后的堆叠网络模型建模,针对单个网络结点,在堆叠网络模型分别构建完成k个子模型之后,重新用全部的数据进行训练,得到一个使用更多数据进行训练的单一模型节点。最后本文比较了各个模型结合粒子群算法之后的效果。实验表明,改进后的堆叠网络模型能够结合各个模型的优点,性能相比传统堆叠网络模型有所提高。
其他文献
为了探讨适宜高压电场处理高粱种子促进种子萌发的机制,以晋杂122号高粱种子为试材,采用完全随机试验设计方法,研究高压电场处理对种子萌发期α-淀粉酶、过氧化氢酶(CAT)、超氧化
蛋白质交联是生物体内普遍存在的一种分子间交联形式,与许多生理及病理过程密切相关。蛋白质如何由单体(有功能的形式)转变为交联的二聚体或多聚体的分子机理还不完全清楚。一
美国资本市场具有上市门槛低、周期短、估值高等优势,吸引了众多存在融资需求的国内企业前往美国发行股票。但近年来,在美国资本市场上市成本增加、风险增大和国内资本市场日趋完善等因素的影响下,大量中概股企业选择在美国资本市场私有化并回到A股上市,这一行为被称为“中概股回归A股”。在成功回归A股的中概股企业中,不乏奇虎360和如家酒店这样的知名企业。与某些中概股企业回归A股后出现的经营业绩下滑、股价萎靡不振
该文设计了一种基于超表面(MS)的低雷达散射截面(RCS)宽频贴片阵列天线。该天线由工作在不同频段的两种开缝贴片天线组成2×4的八元阵,以此实现天线小型化并扩展其带宽,根据相
随着社会的进步和经济的高速发展,我国对于社会生产力的需求逐步增大,对于地质资源勘查技术的要求也有所提升。目前而言,我国在地质岩心钻探技术的研发方面有了很大的进步,随着这
“群文阅读”具有教学的可操作性而得到了一线教师的普遍认可,但现代诗歌的群文阅读教学研究比较少见。诗歌作为文学中的瑰宝,有着陶冶情操、抒发志向的独特魅力,是其它文体难以取代的,然而当前中学语文现代诗歌教学处于尴尬境地,存在改进和提升的空间。本文从群文阅读教学理念出发,探究初中语文现代诗歌的教学路径,以期对改变初中现代诗歌的教学现状有所帮助,为研究现代诗歌群文阅读教学提供有益的参考。全文研究的主要内容
古代埃及家具和古代希腊家具是西方古典家具的两大源泉,继后由古罗马继承并发扬光大,达到奴隶时代的峰巅。接着是中世纪的拜占庭家具、仿罗马式和哥特式,后者受到伊斯兰文明
人民教育出版社2019《普通生物教科书生物学》系列用书于2019年9月开始启用,教材的替换对于教师这一群体来说是一重大考验,课后习题作为教材的重要组成部分,既可以帮助学生巩固检测所学知识,也是教师课堂教学过程中的有利工具。高中生物阶段的新教材开始启用后,对新旧教材中课后习题的比较研究极为关键,以此能帮助高中一线生物教师更好的认识并充分的应用课后习题。本研究以人民教育出版社2004年普通高中课程标准