论文部分内容阅读
本文主要论述了如下四个方面的内容:
1、光电混合神经网络系统衍射误差的仿真研究。
本文介绍了3种类型的光电混合神经网络系统,重点研究了衍射引起的误差对系统输出的影响。根据衍射、光学信息处理和神经网络理论,采用实际实验中的参数和输入数据,对衍射造成的输出误差做了仿真分析。分析表明,瑞利-索末菲区衍射造成较大的输出误差。瑞利-索末菲区与远场衍射综合作用时,误差因输入图像模式不同而差异较大;其中,当输入较小的简单图像时相对误差较大;而对实验中实际采用的复杂图像,相对误差较小。利用线性回归方法对输出数据做了校正,并分析了其可行性,校正后的数据误差降低一个量级。衍射误差对实验中识别率的影响可以控制在较小的范围内,识别率可以保持在97.7%以上。
2、基于图像形态学和模式匹配的中文文档图像压缩。
本文提出了一个高效的、用于中文文档图像的压缩方案,这个方案是基于图像形态学和模式匹配的。其中使用了图像形态学操作方法对汉字进行分解和重组。在重组过程中使用3个判据,特别强调了连通性的重要性,并以此为限定条件构建“最小误差位图”。在模式匹配过程中,设计了适合汉字字型特点的匹配判据。在大尺度模式的空白区域被用来嵌入小尺度模式,从而减小了模式库的尺度。算术编码应用于最后步骤的压缩。本文的方法获得了明显高于比其他各种方法的压缩比,并能保证在内容无损基础上的图像重建。
3、科技期刊文档的页面分析。
本文提出了一个基于已有知识的方法,对文档页面图像做更复杂的分析,以识别各文本区域,并标识它们的功能。这个方法的知识库不仅包括科技期刊文档共有的几何特性知识而且还包括不同印刷风格的几何特性知识。与其他方法类似,这些知识以判断规则的形式给出。为从文本区域中提取小标题,本文使用了字体分析。其中,本文提出了一种称为“加权双线性拟合”(weighted bi-linefit)的方法来估算连通组元的“倾角”,以此来判断一个文本行是否由斜体字组成。综合各种技术,本文提出的方法既可以识别、标识非文本区域的功能,如表格、图片(照片)、线条图形等,也可以鉴别文本区域中的普通段落、各种标题、摘要、页头、页脚和方程等。使用基于等级序列的合并算法,本文方法将邻接的具有相同功能的区域合并,使版面更简洁。本文使用了典型的科技期刊文档图像对本文提出的方法做了实验验证,结果表明,此方法有很好的识别率。
4、复数位图标准和复数位图浏览器。
本文提出了一个记录和显示2维复数数据的复数位图标准。这个名为CMP的标准是仿照普通位图标准(DIB)的文件格式建立的,它便于记录全息光场的分布。本文同时设计了一个查看复数位图的“复数位图浏览器”,可以使用不同的显示方案查看复数位图的强度或相位信息。