论文部分内容阅读
摘要:小波变换是当今应用数学和工程学科中一个迅速发展的新领域。文中首先介绍了小波变换的基本概念,并对其在去噪领域的应用进行了讨论,最后对其发展前景进行了展望。
关键词:小波变换;语音识别;图像压缩
1 引言
传统的信号理论,是建立在Fourier分析基础上的,而Fourier变换作为一种全局性的变化,其有一定的局限性。在实际应用中人们开始对Fourier变换进行各种改进,小波分析由此产生了[1、2]。小波分析是一种新兴的数学分支,它是泛函数、Fourier分析、调和分析、数值分析的最完美的结晶;在应用领域,特别是在信号处理、图像处理、语音处理以及众多非线性科学领域,它被认为是继Fourier分析之后的又一有效的时频分析方法。 小波变换与Fourier变换相比,是一个时间和频域的局域变换因而能有效地从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析(Multiscale Analysis),解决了Fourier变换不能解决的许多困难问题。
2.小波分析的应用
小波分析的应用是与小波分析的理论研究紧密地结合在一起的。现在,它已经在科技信息产业领域取得了令人瞩目的成就。电子信息技术是六大高新技术中重要的一个领域,它的重要方面是图象和信号处理。现今,信号处理已经成为当代科学技术工作的重要部分,信号处理的目的就是:准确的分析、诊断、编码压缩和量化、快速传递或存储、精确地重构(或恢复)。从数学地角度来看,信号与图象处理可以统一看作是信号处理(图象可以看作是二维信号),在小波分析地许多分析的许多应用中,都可以归结为信号处理问题。现在,对于其性质随实践是稳定不变的信号,处理的理想工具仍然是傅立叶分析。但是在实际应用中的绝大多数信号是非稳定的,而特别适用于非稳定信号的工具就是小波分析。
3 小波在语音识别中的应用
自动语音识别技术,它是一种将人的语音转换为文本的技术。语音识别的最终目的就是想人与人之间的谈话象交流信息一样,实现人-机自由对话,也就是赋予机器以听觉,使及其能听懂人的语言,辩明话音的内容或说话人,将人的语音正确的转化成书面语言或有意义的符号,或者进一步使机器能够按照人的意志进行操作,把人类从繁重或危险的劳动中解脱出来。据预测,语音识别将称为继键盘和鼠标之后,人机交互界面革命中的下一次飞跃。
语音识别系统的性能大致取决于以下4类因素:1. 识别词汇表的大小和语音的复杂性;2. 语音信号的质量;3. 单个说话人还是多说话人;4. 硬件。研究人员提出了各种各样的方法,如自适应训练,基于最大互信息准则(MMI)和最小区别信息准则(MDI)的区别训练和“矫正”训练;应用人耳对语音信号的处理特点,分析提取特征参数,应用人工神经元网络等,所有这些努力都取得了一定成绩。
小波分析,作为一种强有力的信号分析工具,近年来被广泛地应用于图象处理和语音处理,它是时间和频率的局部变换,能有效的从信号中提取信息。通过小波变换,在信号的高频域部分,可以取得较好的时间分辨率;在信号的低频域部分,可以取得较好的频率分辨率。这种特性使得小波特别适合于语音信号地处理。小波应用于语音识别系统的预处理中,因为小波的计算特性与人耳的感知过程具有相似性。那么我们可以利用小波多尺度性质,在提取识别特征之前,用小波进行预处理,选取语音信号的有用信息,并且抑制无关信息对识别所产生的干扰。试验表明,把小波滤波器分离出来的各尺度下的剩余信号和原始信号,分别提取带通滤波器族特征进行了试验显示:语音信号的一次小波变换生于信号中携带的信息并没有消失,并且比单纯用原始信号的效果更好,这是因为小波变换的带通滤波器对去用信号进行了衰减和部分滤除,非常类似于人耳的感知过程。可以看出利用小波的带通性质,对于语音识别系统的预处理给出了的小波预处理方法。对于经过小波预处理后提取的特征,对识别更加有效。
4 小波在图像压缩中的应用
数据压缩的理论研究始于1948年香农(Shannon)信息论的提出,1959年,香农又进一步确立了失真率理论,从而奠定了信源编码的理论基础。随后伯杰(T.Berger,1971)[1]等人又对其进行了深入地研究,并取得了一定的进步,为后人对该领域进一步研究打下了理论基础。
随着小波变换、分形几何理论、数学形态学等数学理论和相关学科(如模式识别、人工智能、神经网络、感知生理心理学等)的深入发展,相继出现了新颖高效的现代压缩方法,该方法包括子带编码、小波变换编码[2]、神经网络编码、分形编码、模型基编码等。
随着图像压缩技术在相关领域中的广泛应用,图像压缩的国际标准相继被制定,如在静止图像压缩方面已经制定了CCIT T.81、ISO 10918(JPEG)及JPEG2000等标准。
小波变换用于图像压缩的基本思想是:对图像进行多分辨率分解,分解成不同空间、不同频率的子图像,然后再对子图像系数进行编码。系数编码是小波变换用于图像压缩的核心,压缩的实质是对系数的量化压缩。图像经过小波变换后生成的小波图像的数据总量与原图像的数据总量相等,即小波变换本身并不具有压缩功能。之所以将它用于图像压缩,是因为生成的小波图像具有与原图像不同的特性,表现在图像的能量主要集中在低频部分,而水平、垂直和对角线部分的能量则较少;水平、垂直和对角线部分表征了原图像在水平、垂直和对角线部分的边缘信息,具有明显的方向特性。低频部分称为亮度图像,水平、垂直和对角线部分称为细节图像。所以一个最简单的压缩方法是利用小波分解, 保留低频部分,将高频部分置0。
原始图像首先被分解成低频分量L和高频水平分量HL1 、高频垂直分量LH1 、高频对角分量HH1 ,然后对低频分量L进一步分解,反复至所需分解层次。由于尺度函数具有低通滤波(H) 的作用,小波函数有高通滤波( G) 的作用,对于图像小波分解相当于在水平和垂直方向上进行滤波和亚采样,其逆过程即为图像的重构。
5 小波在中医诊断中的应用
小波变换对中医诊断图像中的处理和对西医诊断图像中的处理大体相同,都是利用小波变换的特点使得医学诊断图像更有利于识别病征,具体作用主要表现为以下几个方面。
(1)中医诊断图像增强? 在中医诊断图像中,图像会难免有对比度差或者图像边缘模糊一系列不利于诊断的因素,对于中医师的准确诊断有不少的障碍。传统的图像增强的方法往往基于像素灰度变换的空间域增强和基于滤波操作的频率域增强来达到图像增强的目的,这样会或多或少产生图像的局部失真和噪声增强。小波变换刚好弥补了这一缺点,即在不改变图像的精确度的情况下,对图像的轮廓进行一种补偿式的增强,使得中医师在对诊断图像进行分析诊断时,更好的把握病人的病情,基于小波变换的医学图像增强的方法有很多,如李清顺等[3]分析了采用分形增强的方法,在分形增强后又采用了小波增强图像的方法,使图像边缘轮廓增强,达到了更好的视觉效果,并且避免了单纯采用小波增强方法会使图像噪声也增强的不足。
(2)中医诊断图像去噪? 在中医师进行诊断的过程中,所得到的图像难免会混入噪声,使图像的信噪比下降,提高了中医师对中医诊断图像分析的难度,对中医师的正确诊断有诸多不利的影响,降低中医师诊断的准确率。对于医学图像处理的传统去噪方法主要有:邻域平均法、多幅图像平均法、中值滤波等。小波变换在此基础上更进一步提高了图像的信噪比,张昌林等[4]概括提出了一种改进的基于小波变换尺度间相关性的去噪方法,小波变换对整个图像变换从时域变换到频域,然后再量化、编码、输出,这样就保留图像的精细信息,满足中医疾病诊断图像的要求。对诊断图像进行去噪处理和方法二维小波变换大大提高了中医师对图像的准确率,可以检测出患者病患的轮廓线,从而有助于提高中医师对各种疾病的诊断准确率。
(3)小波变换在中医脉象信号特征分析中的应用
脉诊是中医诊察疾病的重要手段,脉象反映的是人体的生理与病理信息,脉象信号具有随机性和非线性等特点。由于小波变换有“数学显微镜”这一特性和良好的时-频局域化性质,我们可以通过小波变换这一方法对脉象信号进行处理。谢家宇等[5]应用连续小波变换分析了15例海洛因吸毒者和15例正常人的脉象信号,提取了吸毒者脉象信号中的异常信息,为戒毒治疗的评估与改进提供客观依据。研究结果表明,连续小波变换是处理脉象信号的有效方法。
6 结语
小波变换是20世纪最辉煌的科学成就之一,除了上面所介绍的小波应用之外,小波分析还可以研究不规则图形和混沌运动,分开图像处理,分形信号的奇异性检测。总之小波在计算机应用、信号处理、图像分析、非线性科学、地理科学和应用技术领域的重大突破,预示着小波分析进一步热潮的到来。
参考文献:
[1] The MathWorks, Inc., Wavelet Toolbox. Version 2.1 (R12.1), MATLAB 6.1 06-Apr-2001.
[2] 林福宗,《小波与小波变换》,清华大学计算机科学与技术系智能技术与系统国家重点实验室,2001-9-25.
[3] 李清顺,杨定楚,秦前清.基于分形小波变换的医学图像增强.计算机工程与设计,2005,26(3):807-809.
[4] 张昌林,高红艳,侯玉,等.小波变换在中医诊断图像中去噪处理的应用.上海中医药大学学报,2006,20(4):70-72.
[5] 谢家宇,蔡坤宝,王永东.连续小波变换在中医脉象信号处理中的应用.重庆大学学报,2003.
关键词:小波变换;语音识别;图像压缩
1 引言
传统的信号理论,是建立在Fourier分析基础上的,而Fourier变换作为一种全局性的变化,其有一定的局限性。在实际应用中人们开始对Fourier变换进行各种改进,小波分析由此产生了[1、2]。小波分析是一种新兴的数学分支,它是泛函数、Fourier分析、调和分析、数值分析的最完美的结晶;在应用领域,特别是在信号处理、图像处理、语音处理以及众多非线性科学领域,它被认为是继Fourier分析之后的又一有效的时频分析方法。 小波变换与Fourier变换相比,是一个时间和频域的局域变换因而能有效地从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析(Multiscale Analysis),解决了Fourier变换不能解决的许多困难问题。
2.小波分析的应用
小波分析的应用是与小波分析的理论研究紧密地结合在一起的。现在,它已经在科技信息产业领域取得了令人瞩目的成就。电子信息技术是六大高新技术中重要的一个领域,它的重要方面是图象和信号处理。现今,信号处理已经成为当代科学技术工作的重要部分,信号处理的目的就是:准确的分析、诊断、编码压缩和量化、快速传递或存储、精确地重构(或恢复)。从数学地角度来看,信号与图象处理可以统一看作是信号处理(图象可以看作是二维信号),在小波分析地许多分析的许多应用中,都可以归结为信号处理问题。现在,对于其性质随实践是稳定不变的信号,处理的理想工具仍然是傅立叶分析。但是在实际应用中的绝大多数信号是非稳定的,而特别适用于非稳定信号的工具就是小波分析。
3 小波在语音识别中的应用
自动语音识别技术,它是一种将人的语音转换为文本的技术。语音识别的最终目的就是想人与人之间的谈话象交流信息一样,实现人-机自由对话,也就是赋予机器以听觉,使及其能听懂人的语言,辩明话音的内容或说话人,将人的语音正确的转化成书面语言或有意义的符号,或者进一步使机器能够按照人的意志进行操作,把人类从繁重或危险的劳动中解脱出来。据预测,语音识别将称为继键盘和鼠标之后,人机交互界面革命中的下一次飞跃。
语音识别系统的性能大致取决于以下4类因素:1. 识别词汇表的大小和语音的复杂性;2. 语音信号的质量;3. 单个说话人还是多说话人;4. 硬件。研究人员提出了各种各样的方法,如自适应训练,基于最大互信息准则(MMI)和最小区别信息准则(MDI)的区别训练和“矫正”训练;应用人耳对语音信号的处理特点,分析提取特征参数,应用人工神经元网络等,所有这些努力都取得了一定成绩。
小波分析,作为一种强有力的信号分析工具,近年来被广泛地应用于图象处理和语音处理,它是时间和频率的局部变换,能有效的从信号中提取信息。通过小波变换,在信号的高频域部分,可以取得较好的时间分辨率;在信号的低频域部分,可以取得较好的频率分辨率。这种特性使得小波特别适合于语音信号地处理。小波应用于语音识别系统的预处理中,因为小波的计算特性与人耳的感知过程具有相似性。那么我们可以利用小波多尺度性质,在提取识别特征之前,用小波进行预处理,选取语音信号的有用信息,并且抑制无关信息对识别所产生的干扰。试验表明,把小波滤波器分离出来的各尺度下的剩余信号和原始信号,分别提取带通滤波器族特征进行了试验显示:语音信号的一次小波变换生于信号中携带的信息并没有消失,并且比单纯用原始信号的效果更好,这是因为小波变换的带通滤波器对去用信号进行了衰减和部分滤除,非常类似于人耳的感知过程。可以看出利用小波的带通性质,对于语音识别系统的预处理给出了的小波预处理方法。对于经过小波预处理后提取的特征,对识别更加有效。
4 小波在图像压缩中的应用
数据压缩的理论研究始于1948年香农(Shannon)信息论的提出,1959年,香农又进一步确立了失真率理论,从而奠定了信源编码的理论基础。随后伯杰(T.Berger,1971)[1]等人又对其进行了深入地研究,并取得了一定的进步,为后人对该领域进一步研究打下了理论基础。
随着小波变换、分形几何理论、数学形态学等数学理论和相关学科(如模式识别、人工智能、神经网络、感知生理心理学等)的深入发展,相继出现了新颖高效的现代压缩方法,该方法包括子带编码、小波变换编码[2]、神经网络编码、分形编码、模型基编码等。
随着图像压缩技术在相关领域中的广泛应用,图像压缩的国际标准相继被制定,如在静止图像压缩方面已经制定了CCIT T.81、ISO 10918(JPEG)及JPEG2000等标准。
小波变换用于图像压缩的基本思想是:对图像进行多分辨率分解,分解成不同空间、不同频率的子图像,然后再对子图像系数进行编码。系数编码是小波变换用于图像压缩的核心,压缩的实质是对系数的量化压缩。图像经过小波变换后生成的小波图像的数据总量与原图像的数据总量相等,即小波变换本身并不具有压缩功能。之所以将它用于图像压缩,是因为生成的小波图像具有与原图像不同的特性,表现在图像的能量主要集中在低频部分,而水平、垂直和对角线部分的能量则较少;水平、垂直和对角线部分表征了原图像在水平、垂直和对角线部分的边缘信息,具有明显的方向特性。低频部分称为亮度图像,水平、垂直和对角线部分称为细节图像。所以一个最简单的压缩方法是利用小波分解, 保留低频部分,将高频部分置0。
原始图像首先被分解成低频分量L和高频水平分量HL1 、高频垂直分量LH1 、高频对角分量HH1 ,然后对低频分量L进一步分解,反复至所需分解层次。由于尺度函数具有低通滤波(H) 的作用,小波函数有高通滤波( G) 的作用,对于图像小波分解相当于在水平和垂直方向上进行滤波和亚采样,其逆过程即为图像的重构。
5 小波在中医诊断中的应用
小波变换对中医诊断图像中的处理和对西医诊断图像中的处理大体相同,都是利用小波变换的特点使得医学诊断图像更有利于识别病征,具体作用主要表现为以下几个方面。
(1)中医诊断图像增强? 在中医诊断图像中,图像会难免有对比度差或者图像边缘模糊一系列不利于诊断的因素,对于中医师的准确诊断有不少的障碍。传统的图像增强的方法往往基于像素灰度变换的空间域增强和基于滤波操作的频率域增强来达到图像增强的目的,这样会或多或少产生图像的局部失真和噪声增强。小波变换刚好弥补了这一缺点,即在不改变图像的精确度的情况下,对图像的轮廓进行一种补偿式的增强,使得中医师在对诊断图像进行分析诊断时,更好的把握病人的病情,基于小波变换的医学图像增强的方法有很多,如李清顺等[3]分析了采用分形增强的方法,在分形增强后又采用了小波增强图像的方法,使图像边缘轮廓增强,达到了更好的视觉效果,并且避免了单纯采用小波增强方法会使图像噪声也增强的不足。
(2)中医诊断图像去噪? 在中医师进行诊断的过程中,所得到的图像难免会混入噪声,使图像的信噪比下降,提高了中医师对中医诊断图像分析的难度,对中医师的正确诊断有诸多不利的影响,降低中医师诊断的准确率。对于医学图像处理的传统去噪方法主要有:邻域平均法、多幅图像平均法、中值滤波等。小波变换在此基础上更进一步提高了图像的信噪比,张昌林等[4]概括提出了一种改进的基于小波变换尺度间相关性的去噪方法,小波变换对整个图像变换从时域变换到频域,然后再量化、编码、输出,这样就保留图像的精细信息,满足中医疾病诊断图像的要求。对诊断图像进行去噪处理和方法二维小波变换大大提高了中医师对图像的准确率,可以检测出患者病患的轮廓线,从而有助于提高中医师对各种疾病的诊断准确率。
(3)小波变换在中医脉象信号特征分析中的应用
脉诊是中医诊察疾病的重要手段,脉象反映的是人体的生理与病理信息,脉象信号具有随机性和非线性等特点。由于小波变换有“数学显微镜”这一特性和良好的时-频局域化性质,我们可以通过小波变换这一方法对脉象信号进行处理。谢家宇等[5]应用连续小波变换分析了15例海洛因吸毒者和15例正常人的脉象信号,提取了吸毒者脉象信号中的异常信息,为戒毒治疗的评估与改进提供客观依据。研究结果表明,连续小波变换是处理脉象信号的有效方法。
6 结语
小波变换是20世纪最辉煌的科学成就之一,除了上面所介绍的小波应用之外,小波分析还可以研究不规则图形和混沌运动,分开图像处理,分形信号的奇异性检测。总之小波在计算机应用、信号处理、图像分析、非线性科学、地理科学和应用技术领域的重大突破,预示着小波分析进一步热潮的到来。
参考文献:
[1] The MathWorks, Inc., Wavelet Toolbox. Version 2.1 (R12.1), MATLAB 6.1 06-Apr-2001.
[2] 林福宗,《小波与小波变换》,清华大学计算机科学与技术系智能技术与系统国家重点实验室,2001-9-25.
[3] 李清顺,杨定楚,秦前清.基于分形小波变换的医学图像增强.计算机工程与设计,2005,26(3):807-809.
[4] 张昌林,高红艳,侯玉,等.小波变换在中医诊断图像中去噪处理的应用.上海中医药大学学报,2006,20(4):70-72.
[5] 谢家宇,蔡坤宝,王永东.连续小波变换在中医脉象信号处理中的应用.重庆大学学报,2003.