图文互斥版面中文字阅读顺序的确定

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:clubshe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图文互斥版面中确定文字的阅读顺序是排版及版面理解过程中的一个难点.尤其是中文等东方文字特有的分栏串文互斥,其空间关系的复杂性使得阅读顺序存在歧义.针对此问题,建立新的版面布局模型,并引入新的版面对象PMRegion.给出了版面逐层快速分解构造版面对象和基于有序树的阅读顺序确定算法.已成功运用于专业中日文排版系统,取得了满意的效果,并对更深入研究文档图像理解具有十分重要的理论和实践意义.
其他文献
基于语块的处理方法是近年来自然语言处理领域兴起的一条新思路.但是,要将其应用于口语翻译当中,还需按照口语特点对涉及双语的语块概念做出合理界定.本文在已有单语语块定义
通过对应力影响下语音数据的分析 ,发现不同的特征维对变异的敏感程度不同。一般低维特征对变异比较敏感 ,相应的高维特征敏感程度差些。在此基础上 ,提出一种新的基于特征加权的变异语音识别方法。该方法通过对不同维特征加不同的权值来消除变异因素对语音特征的影响 ,从而提高系统的识别性能。文中提出对线性权值用最大相对熵估计方法获得权值。对航空模拟飞行器中采集的特定话者小词表孤立词的实验 ,最大相对熵估计方法