基于因果稳定学习的乳腺肿瘤分类研究及应用

来源 :东华大学 | 被引量 : 0次 | 上传用户:ai2009ni
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌多发于女性,其发病率居妇女恶性肿瘤首位,是女性死亡的第二大因素,严重威胁女性健康。临床研究至今未明确乳腺癌的直接致病因素,这使得目前尚无有效的乳腺癌一级预防措施,因此,早期的诊断尤为重要。在乳腺癌检查中,乳腺钼靶检查凭借其对微小钙化更为敏感的优点,成为乳腺肿瘤的主要辅助检查手段,其检查报告是临床医生进行乳腺肿瘤性质判定的重要依据。因此,利用乳腺钼靶检查报告辅助医生进行乳腺肿瘤诊断,缓解乳腺肿瘤筛查中医生的压力,是智慧医疗、智能诊疗的重要体现。目前,用于乳腺肿瘤诊断的深度学习模型取得了较好的效果,但由于其忽略了实际数据的复杂选择过程,即模型测试和训练数据可能存在分布偏移问题,致使模型稳定性较差。且这些模型大多缺乏可解释性,而医疗领域中的诊断、预后模型对模型的安全和可靠是极度敏感的,无法为医生提供足够可靠的决策结果解释是模型在实际临床中无法普及的一大原因。为实现基于乳腺钼靶检查报告的乳腺肿瘤良恶性精准诊断,同时改善模型的稳定性与可解释性问题,本文基于上海市某三甲医院的真实数据,提出了基于因果稳定学习的乳腺肿瘤分类模型(SSC-Tab Net),并结合该模型的自解释与事后可解释方法为决策结果提供可解释性分析。为实现辅助临床医生的诊断,本文基于该模型设计并搭建了乳腺肿瘤辅助诊断系统。本文的研究内容主要分为以下三个部分。(1)构建基于因果稳定学习的乳腺肿瘤诊断模型该部分提出了一个SSC-Tab Net模型,首先基于乳腺钼靶检查报告的构成及结构特点完成数据集准备。然后按照“段-组织描述句-属性描述句”规则,基于乳腺钼靶语义树实现钼靶报告的结构化,以此获取钼靶报告丰富的语义层次。之后,使用非线性函数将输入数据映射到低维空间,在保留原始特征信息的同时降低特征维度,以此缓解数据的缺失情况。同时,在低维空间中有助于后续全局平衡权重的学习。最终,利用因果推理学习全局平衡权重,并使用该权重指导模型的特征选择过程,用于提升模型的稳定性。实验结果表明,本文所提出模型比传统的结构化数据分类算法具有更好的准确率与稳定性。(2)实现基于模型自解释与模型事后解释的可解释性分析该部分对SSC-Tab Net模型进行了可解释性分析,首先分析了该模型决策乳腺肿瘤性质的内部机制,计算每一决策步权重系数矩阵的加权和,将其作为乳腺肿瘤特征的重要性分数,实现模型的自解释。然后使用模型事后可解释分析方法获得任一乳腺肿瘤特征对模型决策的贡献度,为模型提供补充性可解释分析。本文联合模型自解释与模型事后解释方法,共同为模型提供可解释分析,提高模型的可靠性。(3)设计并搭建乳腺肿瘤辅助诊断系统为将模型应用于临床实际,有效辅助医生诊断,该部分设计搭建了一个乳腺肿瘤辅助诊断系统。该部分从医生角度出发,进行用户需求分析、功能需求分析及用例设计,并依据其完成系统总体框架、实现的技术方案和数据库的设计。最终实现了钼靶报告的管理,报告的诊断及可解释分析等功能。
其他文献
近年来,在互联网技术不断普及和贸易保护不断抬头的背景之下,国际市场的竞争愈加激烈,我国传统制造业企业在出口过程中的劣势也愈加明显,转型升级迫在眉睫。《中国制造2025》等中央出台的重要文件中都明确指出:延伸服务环节、增加高端服务要素投入、加快两业融合发展是促进制造业企业改善效率、获取差异化竞争优势的重要手段。然而,对于尚处转型初期的中国,也可能会产生“服务化悖论”。这种因素的存在,使得学术界无法对
学位
从报纸、电视、门户网站到现如今的社交媒体,随着科技与互联网技术的飞速发展,人们获取信息的途径发生了巨大的变革,从单一的、中心化的信息传播方式变成了人人都可以参与的自媒体时代。凡事都有双面性,人们在弹指间获取世界各地正在发生的时事新闻的同时,也面临着大量混淆视听的虚假新闻。打击虚假新闻对净化网络环境和提高媒体公信力有重大意义。作为近几年新兴的研究课题,目前虚假新闻检测方法存在着适用性不广、时效性滞后
学位
在国家“双减”政策的背景之下,社会越来越强调学校教育教学的高效性,同时,“核心素养”越来越多地进入到一线教学工作者的视野中。教师们面临着时代给教育带来的契机和难题,急需理清核心素养在一线教学实践中的定位。部编本教材自2016年发行以来,逐渐在全国范围内实现“一纲一本”的局面。笔者通过进行师生问卷和访谈,发现其“练习系统”得到教师和学生的高度认可,但使用率却很低,集中表现在教师不清楚练习系统的训练目
学位
近年来,随着献礼剧质量的节节攀升,其播放量和关注度也日益提升,建党100周年献礼剧《觉醒年代》更是独占鳌头,大放异彩。其以浓厚的历史底蕴、真切的创伤情感、绝伦的艺术呈现为观众架设了一条沟通历史和现实的桥梁,令受众争先参与互动,并由此进入笔者视野。在观察的过程中,笔者发现,虽然观众并未亲历百年前的历史,但通过《觉醒年代》的塑造,受众的集体记忆却无疑更加凝实,而《觉醒年代》对于集体记忆的建构,也是一个
学位
2020年新春伊始,一场突如其来的新冠肺炎疫情席卷祖国大地,至今疫情尚未结束。在我国社会主义制度强有力的保障下,经济在逐步复苏之中,政府出台了一系列减税降费、降低贷款利率等扶持政策,同时生产技术和信息技术的发展推动了我国食品行业的深入改革,给饮料企业发展提供了更多的机遇。随着人口素质的提高,消费观念在不断地升级转变,营销渠道线上线下双向发展,消费方式的快捷便利化,各类饮料企业百花齐放,该行业的残酷
学位
近年来,随着全球化竞争压力的不断加剧,中国银行业不断加快市场化的脚步,全面提升银行核心竞争力。作为银行发展零售业务的有力平台,信用卡业务在历经数十年的发展后,已经步入了精准化营销管理的阶段。Z银行大连分行在大连地区的信用卡业务起步较早,近期同业竞争愈发激烈,加之近年受疫情的影响,同时大连地区人口流失较为严重,新客户获客难度越来越大,优化客户关系管理、强化存量客户精细化经营愈发重要。分析2020年Z
学位
糖尿病是一种常见的慢性代谢疾病,会引发多种严重威胁人类生命健康安全的并发症,包括糖尿病性肾病和糖尿病性心血管疾病等,其相关的预防和治疗工作已经成为一个重大社会挑战。其中,糖尿病性心血管疾病是导致糖尿病患者残疾和死亡的主要原因,也是一种可防可控的疾病,做好糖尿病性心血管疾病的早期干预和治疗,可以有效控制疾病进展,提高糖尿病患者生存率。因此,寻求一种有效的糖尿病性心血管疾病风险评估方法,用于疾病的早期
学位
在社会经济高速发展的今天,人们提前消费的热情日渐高涨,随着“互联网+”和大数据技术的发展,信贷业务也在线上线下呈现出多种多样的业务形态。个人信贷业务需求量的不断增长使银行等金融机构获得可观的利润收入和大量的客户数据积累,但与此同时,由于监管审核不严格和信息差等因素,不良贷款率也逐渐攀升。因此,如何充分利用客户数据中的有用信息进行有效的信贷违约预测已成为急需解决的问题之一。论文基于真实信贷数据集,通
学位
随着经济的不断发展,用户对家电产品的需求趋于多样化和个性化,传统的设计方法已无法满足家电产品的快速定制化设计;由于家电产品的需求量大、更新速度快,导致其废弃量不断增长,而现阶段对于废旧家电的回收处理方式也存在不足,致使大量的废旧家电堆积难以处理,故而应该尝试从源头来解决问题,即在家电产品的设计阶段就考虑其绿色属性。因此研究家电产品的绿色模块化设计意义重大。本文根据绿色模块化设计理论,研究了基于原子
学位
20世纪80世纪以来,互联网正一步步的改变人们的生活并影响社会的发展。在互联网技术的变革下,传统的金融模式和互联网技术相结合衍生出互联网金融,特别是传统小额贷款公司与互联网、大数据技术的迅速结合,以全新的模式快速发展。与此同时,互联网小贷在我国尚处于初级发展阶段,互联网的涉众性和传导性将金融本身的不稳定性和高风险性放大,容易造成系统性金融风险。2020年之前,互联网小贷公司通过高利率覆盖高坏账的方
学位