基于复数神经网络的心肺音分离与识别

来源 :石珍 | 被引量 : 0次 | 上传用户:xiaolinshihonggang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来心肺疾病逐渐成为威胁人类健康的首要因素之一,听诊是诊断众多心肺疾病最便捷与经济的手段。目前,听诊环节在就诊过程中日趋弱化,而新冠疫情导致的医疗资源紧缺、传统听诊使医生暴露于危险之中等情况使该问题愈发严重。电子听诊器,因其可实现无线连接、实时转录以及在线分析等优势,成为解决问题的新手段。特别的,近年来涌现的深度学习方法具有优秀的数据特征挖掘能力,使得对心肺音信号的在线自动分析识别成为可能。在使用电子听诊器收集信号时,心音与肺音常会呈现混合状态,这将严重影响后续的识别任务,因此需要研究心肺音分离方法助力后续识别任务,提高人工智能电子听诊器的实用性。传统的语音/声信号单通道分离方法往往只处理STFT结果的幅值,但混合状态的相位会带噪声干扰,且没有考虑到心肺音的特点。此外,目前心音或者肺音识别的对象通常是纯净的心肺音,没有研究工作对比心肺音分离前与分离后的识别效果。本文面向心音与肺音高度重叠、相互影响这一被过往研究忽视的实际场景下的心肺疾病诊断问题,发掘复数人工神经网络以及心肺音特点,研究心肺音分离与识别方法,主要开展如下两部分工作:第一部分的工作着重研究了心肺音预处理环节中的心肺音分离问题。针对常见单通道语音分离方法只注重在STFT后时频谱实数域上的处理,造成部分信息浪费或丢失的现状,本文基于复数神经网络设计编解码网络用于心肺音分离。此外,在心肺音分离过程中特别考虑心音信号的准周期性,基于循环平稳性对其进行量化,利用循环平稳代价函数计算其循环平稳频率作为损失函数的一部分用于心肺音分离网络的优化。本文所提出的基于循环平稳性优化的复数神经网络心肺音分离方法,充分利用了时频谱的全部幅相信息,循环平稳代价函数的引入不仅优化了心音的分离结果,还改善了肺音的分离结果。所提出的心肺音分离方法可很容易地给出在线输出版本,并在各种仿真或者实际场景下的心肺音分离任务中进行了性能验证。通过实验,与最新发表的心肺音分离方法相比,本文所提出方法输出的心音与肺音均取得了更高的信号伪影比(SAR)、信号失真比(SDR)以及信号干扰比(SIR)。第二部分工作研究心肺音识别方法,并结合心肺音分离方法评估心肺音分离-识别完整处理过程后最终的心肺疾病诊断效能。由于心肺疾病的多样性,本文以一个心脏疾病五分类任务:主动脉瓣狭窄(AS)、二尖瓣反流(MR)、二尖瓣狭窄(MS)、二尖瓣脱垂(MVP)以及正常心音分类为问题抓手,研究心音分类方法。本文受软注意力机制中典型代表——SENet的启发,提出基于复数SENet的识别方法:将STFT时频谱输入到由复数卷积模块与复数SENet构成的网络中提取其深层特征,通过全连接层给出分类结果。通过与已发表的多个心音识别方法进行对比,本方法识别结果的各项指标最高。联合本文所提出的心肺音分离方法,将此方法应用到心肺音混合数据上,同样得到了较好的识别结果。本文考虑实际应用场景,从心肺音分离、心肺音识别两个相衔接的任务出发,发挥复数神经网络在综合利用幅相信息方面的优势,提出相应解决方案。其中基于复数神经网络及循环平稳代价函数的心肺音分离方法可以获得纯净的心音与肺音信号;基于复数SENet的心肺音分离后的心音识别可以获得较为准确的心音识别结果。本文同时考虑这两个相互衔接的任务并提出优化的联合解决方案,最终为实际场景下电子听诊器心肺疾病自动诊断研究提供了稳定可靠的方法论。
其他文献
随着信息时代的到来,电子产品的发展也日新月异,并且短时间内一跃成为我国增速最快的产业之一。很多人在驾驶汽车时会给手机、U盘等电子产品充电及传输数据,为此,很多汽车也都配备了车载USB接口。然而,市场上车载USB HUB种类繁多,质量良莠不齐,不仅安全隐患大,而且使用过程中可能会缩减电子产品的使用寿命,严重时甚至会威胁到人身安全。因此需要设计一套汽车USB HUB性能检测系统,以保证USB接口工作时
学位
中职学生作为特殊的青少年群体,他们在学习上的问题往往比普通学生更为复杂。针对传统班级授课制的突出弊端,本研究意在通过对分层教学进行探索实践,以期从一定程度上缓解班级授课制的不足,提升中职学生的学习兴趣、学习信心、学习获得感。通过对国内外分层教学的发生发展史以及学术研究史进行梳理,理清了分层教学概念的缘起与发生发展历程,认为分层教学是一种解决问题的系统性策略,多元智能理论、最近发展区、因材施教等是分
学位
近年来,随着5G、人工智能和AR/VR为代表的新一代信息技术的兴起,互联网网络流量快速增长,这给以光网络作为主要承载网的骨干网造成了巨大压力。为此,需要对现有光网络进行带宽扩容。考虑到多波段技术具有以高性价比扩容10倍的优势,运营商更倾向于采用多波段光传输扩容方案。由于不同波段之间存在串扰,目前多波段光传输的研究主要聚焦于C+L波段光网络。本文围绕C+L波段光网络优化设计展开了研究,具体研究包括C
学位
交通拥堵、交通安全问题是当前世界性难题,严重制约社会经济发展。以车路协同为特征的智能交通成为解决交通问题的有效方式,利用各类先进传感器部署于路侧,进行交通信息感知与获取,成为解决交通问题的重要模式。激光雷达传感器具有高时空分辨率及主动测距的特点,是交通场景中进行高分辨率微观交通信息感知与获取的有效手段。由于单个激光雷达部署于路侧时存在检测距离有限、目标间相互遮挡等问题,通过在路侧部署多个激光雷达,
学位
眼神接触效应(Eye Contact Effect)是指个体感知到的眼神接触会调节同时和随后的认知加工和行为反应。本论文主要围绕使用真人或视频时的眼神接触效应和多人社会互动情境下的眼神交流展开。具体来说,本研究考察了社会互动的可能性与互动对象在场与否是如何影响眼神接触效应的(实验一),以及个体与多个互动对象进行眼神交流时,是否存在着替代性眼神接触效应和多人眼神接触效应(实验二)。实验一通过三种不同
学位
古代织物上的童子纹,满载着时代印迹,在漫长的中国纹样史洪流中已流行近千年。从童子各异的身形样貌和衣着发髻中,后人得以一窥不同时代的民俗风情和文化观念。本文以中国古代织物中的童子纹作为研究对象,着力梳理了其历史流传及实际应用,并从历史发展角度充分探索其起源、流变和盛行的全过程。本文着重从以下几点进行论述:1、“童子”相关语汇及释义的解读,并简述该类纹样在织物上的流变;2、汉唐时期东西方文化交融背景下
学位
进入5G时代,随着人们对智能手机使用质感追求的提升,手机工业设计也不断推陈出新,以陶瓷为机身、金属为边框的全面屏手机已经成为了一种设计趋势,同时为了满足多频段信号的传输,5G金属边框手机的天线设计将具有以下难点:1.天线频段增加导致天线总数变多;2.手机的全面屏设计使得天线可使用的空间变小;3.手机内部附加零件的增多让天线环境恶化,导致天线性能下降。因此,设计一款多频段、小型化、超宽带的手机天线系
学位
汉语反问句识别是指判断句子是否为反问句,属于二分类任务,其关键是探究反问句与非反问句之间的异同点。针对中文反问句当前研究现状,本文从语料库构建、反问句识别、隐式反问句识别三个方面进行研究,主要内容有:(一)汉语反问句语料库研究与建设针对汉语反问句研究方面尚无公开可用的语料库的现状,本文提出了一种半自动反问句语料收集方法。首先,构建基于特征词典的反问句识别器来筛选数据中较有代表性的反问句;接着,制定
学位
开关电源凭借体积小、重量轻、效率高、可靠性高等优点,在国民经济、日常生活各个领域得到了广泛应用,占据了大部分市场份额。面对绿色节能、数字化的发展方向,电源市场对开关电源的功能和性能提出了更高的要求,为了进一步提高开关电源的效率、集成度和可靠性,本文对高性能AC/DC开关电源进行了研究和设计。本文基于功率管限流点控制和反激变换器原理对开关电源驱动芯片和系统电路进行了设计和仿真。设计了无运放带隙基准电
学位
通用滤波多载波技术(Universal Filter Multi-Carrier,UFMC)由于频谱利用率高、带外功率泄漏低和时频偏移鲁棒性强,在高速无源光网络(Passive Optical Network,PON)和移动前传网络中具有广阔的应用前景。而实现高速UFMC通信,提升UFMC系统传输容量主要有两种方式,提高信号波特率和增加正交幅度调制(Quadrature Amplitude Mod
学位