面向医学影像的深度跨模态检索方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:heephy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨模态医学图像文本检索可以通过医学图像检索得到对应的诊断报告或者通过诊断报告检索得到对应的医学图像,向医生提供包括医学图像和诊断报告在内的相关过往病例,可以提高临床决策的准确率和效率。跨模态检索任务需要学习到具有跨模态一致性和类间判别性的多模态特征,以便通过距离度量实现跨模态检索。然而多模态医学数据中医学图像相对于自然图像类间差异性更小且图像模态和文本模态的模态间差异更大,图像模态难以学习到具有语义判别性的图像特征。此外,一张医学图像通常包含了多个病症区域,所以医学数据样本通常具有多个语义标签且较为复杂。如何从色彩、纹理信息不丰富且噪声较大的医学图像中提取与诊断报告内容相关的复杂语义信息是一个难点。目前已有的跨模态检索方法大多是应用于自然数据集,没有考虑到医学领域中图像模态的学习难度远大于文本模态的问题,以及多标签医学数据中复杂的语义信息难以学习的问题。因此,本文提出了两种模型,基于复杂模态判别性增强的跨模态医学图像文本检索模型和基于多模态语义融合的医学图像文本检索模型。1.针对医学领域中图像模态复杂程度远大于文本模态的问题,本文提出了基于复杂模态判别性增强的跨模态医学图像文本检索模型。该模型通过图像模态子网络生成图像特征并利用对比学习方法增强图像特征的语义判别性,通过文本模态子网络生成文本特征,利用图像文本对的成对关系减小图像模态和文本模态之间的跨模态差异。此外,通过模态间参数共享的标签预测网络生成预测标签,构建标签预测损失,约束模型进一步减小跨模态差异并提升多模态特征的语义判别性。在三个医学数据集上的实验表明,该方法在跨模态检索精度上取得了一定的提升。2.由于一张医学图像通常显示了多个病症,所以一张医学图像和一份诊断报告一般属于多个语义类别。为了学习到多标签医学数据中复杂的语义关系,本文提出了基于多模态语义融合的医学图像文本检索模型。该模型通过语义模态子网络生成语义特征,然后利用一个模态间共享的跨模态注意力块提取文本特征、图像特征与语义特征之间相互关联的语义信息。并且特征空间和标签空间中的监督损失也充分利用了语义标签。实验表明该方法提升了在多标签医学数据集上的跨模态检索准确率。3.设计并实现了一个胎儿超声图像-诊断报告跨模态检索原型系统,该系统对本文提出的跨模态检索模型进行了封装,能够实现胎儿超声图像和诊断报告模态内与模态间的检索。医院妇产科医师可以在系统中输入胎儿超声图像检索相关诊断报告,输入诊断报告检索相关胎儿超声图像,输入胎儿超声图像检索数据库中相似的胎儿超声图像,输入诊断报告检索数据库中过往相同病症的诊断报告。
其他文献
文本主题内容的提取在自然语言处理领域内是一个基础性的研究问题,它为人工智能的各种应用提供了相应基础。然而受传统挖掘技术的限制,智能化的准确提取文本内容还存在较大问题。特别是在过去的几年里,人们存储数据的能力不断提高,再加上互联网的日益普及,已经创建了大量的电子文本,这使得人工阅读甚至传统挖掘技术去适应这快速发展的信息社会已经显得不合时宜。因此研究一项能够快速且智能化提取文本内容的模型,有助于推动整
学位
随着互联网商品交易日益频繁,商家希望能够从用户评论中了解用户的喜好,从而改进商品。传统情感分析的困境在于无法准确判断评论中用户对商品各个方面的情感偏好,而方面级情感分析这类细粒度的方法能够有效识别不同方面的情感,因此更能满足商家的需求。基于依存句法的方法能够捕获方面词与意见词之间的远距离信息,从而被广泛用于方面级情感分析任务,但该类方法仍然存在句法信息学习不足,以及句法信息学习与上下文信息学习分离
学位
随着移动互联网的快速发展和应用,移动应用程序成为人们进行移动办公、社交活动以及网络购物的重要载体。通过流量识别移动设备上安装的应用程序是网络管理员和营销机构等获取信息的重要手段。识别移动应用流量可以为移动互联网流量的配置部署提供支持,改善基于业务或者应用的细粒度移动网络资源分配,增强移动网络和应用程序的安全性。由于移动应用程序的多样性以及加密协议的大量使用,传统流量识别技术不能很好地适用于移动端的
学位
<正>2022年6月23日,深圳市第七届人民代表大会常务委员会第十次会议通过了《深圳经济特区智能网联汽车管理条例》,自2022年8月1日起施行。《条例》全面贯彻中央战略部署,在与国家法律、法规、规章相衔接的基础上,在国内首次对智能网联汽车的准入登记、上路行驶等事项作出具体规定,是国内首部关于智能网联汽车管理的法规。
期刊
随着互联网大数据的到来,人们时刻面临着网络信息过载的问题,加之网络新闻中充斥着大量的“标题党”现象。因此,越来越多的人对文本摘要生成感兴趣。文本摘要技术属于自然语言处理领域,是利用计算机对原文内容进行分析,将关键含义提炼出来,形成简短文本的技术。近年来,大量学者们在文本摘要技术上有所研究,使之有了很大的进步,但依然面临着诸多挑战。本文针对抽象文本摘要方法中存在信息丢失以及未登录词等问题,研究自动关
学位
如今网络自媒体和电商平台逐渐成为大家生活中不可缺少的一部分,用户越来越倾向于在网络上留下自己的评论和看法,由于这些带有情感和观点的文字信息影响着舆论方向以及作为商家和卖家行动的参考,情感分析已经成为一个热门的方向。在单个评论中,经常会出现多个情感的表达,为了更准确的对文本进行分析,诞生了方面级情感分析。方面级情感分析能获得更有针对性更准确的情感表达,已经成为当下研究的热门课题。方面级情感分析的模型
学位
对于事实类问题,问答系统比传统搜索引擎给出的答案更准确与简洁。与关系型数据库不同,知识图谱可以将数据按照逻辑网络的形式进行存储,并能以符合人类认知的方式来描述实体与实体之间语义关系。基于知识图谱的问答系统既有知识图谱的数据存储表示优势,又具备问答系统的优势,是目前关注的热点之一。目前基于知识图谱的问答系统虽然能有效地解决简单问题,但是仍然存在数据信息利用不完全以及语义理解不充分的问题,同时对多跳问
学位
明湖是安徽省唯一项目入选水利部首批幸福河湖建设项目,项目以提升人民幸福感为目标,依托河长制,通过治理河湖和保护生态,打造美丽城市,为市民提供更好的居住生活环境。文章分析了明湖建设过程的具体做法、建设亮点及取得的初步成果,并对项目未来进行了展望。
期刊
面对人工智能引起的新一轮产业变革,安全、可信的智能系统是保障社会实际应用的重要基础。然而,理论研究与实际测试表明智能技术尚不成熟,构建安全可信的模型算法仍是研究领域中的难题。图深度学习模型,例如图卷积网络,因为在一些任务上的出色表现引起了研究人员的关注。然而,图深度学习模型易受对抗攻击产生的对抗样本影响,对抗样本严重影响了深度学习模型的实际性能。因此需要促使研究者设计一种先进的防御方法,以削弱潜在
学位
全面推行河湖长制已进入全面强化、标本兼治、打造幸福河湖的新阶段。建设幸福河湖是推进高质量发展的必然要求,是建设人与自然和谐共生的现代化的重要举措,也是对人民群众美好生活向往的切实回应。文章总结归纳江西省现阶段幸福河湖建设工作,通过梳理幸福河湖建设的背景和意义,分析建设进展及问题,研究提出了幸福河湖后续建设工作的建议,可为进一步完善河湖治理体系,提升河湖治理水平,指导幸福河湖建设和管理提供参考。
期刊