论文部分内容阅读
作为认知科学和计算机科学中的一个令人兴奋的活跃分支,数字图像处理技术近年来得到了极大的重视和长足的发展。特别是视觉信息的飞速膨胀和应用需求的不断扩大,使得面向不同领域、不同任务的算法研究成为图像处理及相关领域关注的热点。尽管人们在图像处理算法方面做了大量的工作,但对算法各种性能进行评价的研究却相对较弱,其中一个很重要的原因就是对所研究的对象——图像本身缺乏足够的认识,更没有科学的、客观的描述手段,致使对图像处理的研究还处在“自然研究”阶段,没能进入“自觉研究”的阶段,因此带有许多盲目性。 本文研究的是基于图像本质属性的图像分类,即在对图像中与人的视觉感觉相关的本质属性进行客观度量的基础上,对图像进行系统的分类研究。研究的目的在于:(1)任何一个成熟的学科都要对研究的对象进行分类,只有在对处理对象从数学意义上加以区分,才有可能在一定范围内对处理结果进行预测,给出处理结果的评价标准和方法,才能形成该学科的理论体系。(2)对图像本质属性的客观度量,可以减少算法中的假设,使得算法的自适应性成为可能,这种自适应性包括算法的自适应选择和算法中参数的自适应配置两个方面。(3)对图像进行定量的、客观的分类研究,有助于产生成熟的算法评价方法和规则。“一门科学没有科学公认的评价系统、性能描述和算法的再实施能力,就没有发展”。因此这种评价不仅可提高现有算法的性能,对研究新的算法也具有指导意义。 论文的主要思路是围绕图像低级处理三大任务——图像增强与恢复、图像压缩和图像分割,寻找和研究图像的基本属性,进而建立图像的形式化描述,然后面向任务将图像按基本属性进行分类。本文将图像的属性描述限定为与自适应算法和结果有关的、反映人的视觉感觉的图像基本属性。研究的主要成果包括: 建立了基于图像属性的图像模型,给出了图像形式化描述的框架。按照可拓学方法,定义了图像基本元素——视元;考虑到人类视觉的层次性,将视元具体确定为像素层视元、区域层视元和图像层视元;分析了视元的性质、视元各层间的关系等。图像的形式化描述,将各类图像统一在同一个框架下,便于进一步的研究与分类。