放射科语音识别系统中环境自适应技术的研究与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhangyang_8591
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着大中型医院放射科设备性能的改善,医院的看病效率有了很大的提高,每天病人的诊断数量也在不断上升,影像诊断医生的工作负荷量也随之加重。并且伴随着影像显示器逐渐替代胶片,诊断报告的撰写方式和工具已经向数字化阶段迈进,随之而来的是如何高效率使用报告撰写工具的问题。有些医院放射科曾采用诊断医生口述录音并由语音转换员听写生成最终报告的方式,费时费力,人工成本高。伴随着语音识别技术的不断成熟,该技术已经被运用到医疗信息化建设中。放射科医生可以自己操作语音识别引擎,直接生成诊断报告,控制生成时间及其质量;并且可实现实时签发,而不再考虑转录员对报告所产生的延迟影响。语音识别技术已经在以美国为首的西方国家成功运用到医院放射科、病理科、急诊室等部门中,很大程度上提高了工作效率,降低了医院日常运作成本。但是目前我国医院还没有成功使用连续语音识别技术撰写诊断报告的案例,其中主要的原因之一就是连续性汉语语音识别系统在实际的环境中没有达到较理想的准确率与识别速度,而国内医院看病人群密度大、环境嘈杂的特点与识别系统得到训练的实验室环境不匹配,极大影响了连续语音系统的识别效果。如何提高连续语音识别系统的环境鲁棒性成为该技术在国内医疗领域普及的关键因素之一。本文基于开源语音识别引擎Sphinx,设计与实现专门应用于放射科影像诊断报告语音录入环节的连续性语音识别系统,在该系统基础上分析环境自适应算法在抗噪声语音识别中的应用,并提出了一种新型的自适应方法,最终设计和实现了完整的环境自适应流程,证明了所提出的环境自适应新算法能有效改善系统在噪声环境中的性能。本文的主要内容首先是详细讨论了语音识别相关的关键技术,主要包括HMM的核心思想与基本算法,以及基于HMM建模的声学模型;为构建放射科语音识别系统以及环境自适应技术的研究奠定理论基础。其次,分析噪声对语音识别系统的影响以及常见的语音抗噪技术,在前人研究工作基础上提出一种新的基于噪声环境的模型自适应算法,即在MAP方法中引入一个简化的MLLR模块。最后,基于开源语音识别引擎,构建放射科语音识别系统,并设计噪声环境自适应流程和测试流程,针对放射科颅脑以及肺部X线放射影像报告语音录入语料,训练相关声学模型,并用带噪语音数据集进一步自适应;对实验结果进行了分析,比较所提出的新自适应方法与MAP、MLLR方法各自对噪声环境的自适应效果,最终通过实验数据证明该算法提高了语音识别系统在噪声环境下的性能。
其他文献
学位
新时代政府关注、扶持明星村发展,希望其在乡村振兴与脱贫攻坚中起到典型示范作用,这是我党在解决点和面发展矛盾方面的好经验.结合新时代社会主要矛盾的变化以及乡村供给侧
本文用“准三维”数值模拟方法研究吹气发泡法制备泡沫铝的过程中,单个气泡在铝熔液搅拌流场中的运动与变形。搅拌流场的模拟,采用多重参考系(Multiple Reference Frame)法和标准k-ε模型进行三维模拟。气泡运动和变形的模拟,在根据三维流场的计算结果简化出的“准三维”模型中进行。应用VOF(Volume of Fluid)方法对气液之间的界面进行追踪,应用CSF(Continuum S
新型超级冷却技术是基于热驱动理论的一种新型冷却技术。通过前期研究发现,热驱动介质热物性的差别对热驱动换热具有很大的影响。本文针对液态金属钠钾合金的热驱动换热特性
禽类包括鸡、鸭、鹅及野禽。禽肉往往比畜肉更受到人们的欢迎。这是因为禽肉在营养价值上更高一些,且肉质更为柔嫩细腻,滋味与风味更为诱人,更易于消化吸收。其次,由于禽肉含有较
公共危机事件发生后,很多社会群体不依赖于正式应急动员机制,通过自发行为或立足本职岗位参与危机治理.在此次新冠肺炎疫情防控中,一些社会群体发挥了重要作用,他们事实上已
“导风墙—烘干床”式球团竖炉(简称竖炉)是一种具有自主知识产权的球团矿焙烧设备,多年来在球团生产中占有重要地位。随着我国钢铁产量的逐年增长,对球团矿的需求量剧增,竖炉因
家蚕丝素蛋白(Silk Fibroin, SF),是一种天然蛋白质纤维,是人类利用很早的蛋白质之一。近年来,众多研究表明丝素蛋白具有良好的生物相容性、极缓慢的降解速度、低免疫原性等