论文部分内容阅读
该论文针对JPEG2000压缩图像,以纹理特征提取、语义对象检测等为研究切入点,从检索和压缩相结合的角度研究基于小波压缩域的图像检索技术.主要研究成果包括:(1)研究了一种基于小波压缩域的高效纹理特征提取新方法.针对目前基于小波的纹理分类方法的局限性,充分考虑与图像压缩标准的兼容,突破以往对各子带独立分析、仅利用子带内统计特性提取纹理特征的常规思路,引入子带间的统计特征,大大提高了小波压缩域纹理图像分类的准确性.对2个典型纹理图象库分类测试结果表明该方法具有良好的分类性能.(2)研究了图像中常见语义对象——字符的压缩域定位技术.依据字符的纹理特点及其在小波压缩域的表现,从边缘图提取、字符点检测及自适应多阈值边界确定等关键环节着手,提出了一种压缩域字符定位方法.该方法可在不完全解压的情况下,快速、准确、鲁棒的定位复杂背景下的字符区域.与其他定位方法相比,此方法的优势是在确保检测正确率较高、误检率较低的前提下,定位时间显著缩短.(3)作为图像中另一种典型语义对象,人脸检测也是图像检索中的一项重要研究内容.该论文从压缩域的角度出发,对基于小波压缩域的人脸检测进行了研究.通过分析可变尺寸人脸模式在小波压缩域的表现形式,提出利用多级梯度能量描述来表征人脸模式,从而使不同尺寸的人脸具有基本一致的特征描述.同时,提出了缩放检测窗口与多级特征描述相结合的搜索策略,首次解决了压缩域人脸检测中尺寸未知的问题,实现了基于小波压缩域的具有尺度不变性的快速、准确人脸检测.提出的人脸模式多级特征描述思路也可推广至其他压缩域,避免压缩域人脸检测中复杂的图像缩放平移操作.试验结果表明,提出的基于压缩域的人脸检测方法是高效可行的.(4)提出一种直接基于JPEG2000压缩码流的快速图像检索方法.通过分析JPEG2000压缩码流中的包头信息与子带能量的关系,直接从包头提取码块零位平面数,码块编码通道数及码块编码长度信息,进而基于这些信息以子带为单位构建与小波子带能量具有相似内容描述的特性矢量,实现了基本无需解码的压缩图像快速检索.实验结果表明该方法是快速有效的.利用这种检索技术,对以压缩格式存放的图象数据库,无需额外的特征库,可在检索过程中快速计算特征量,极大地提高动态图像数据库的管理效率,利于进行基于因特网的图像检索与查询.