论文部分内容阅读
数字媒体约简算法致力于在保留数字媒体数据的本质特征的同时,能够精简数据规模或者简化处理数据方法的相关算法的研究。数字媒体中约简算法的关键往往在于如何使得约简后的数据或方法能够较好地表示原始数据的本质信息,通常以贪心算法或迭代算法控制简化数据的精简规模和近似表示原始数据的准确度。本文以数字媒体约简算法为主线,针对数字图像、数字视频和数字几何模型相关的四种约简问题做了进一步的研究,取得了以下创新成果:首先,我们针对内容保持的数字图像缩放问题设计了一种新颖的实时计算方法。我们将该缩放问题转换为一张基于图像本质特征和显著度信息构造的三角网格的变形问题。变形后的三角网格中所有三角实际发生的纵横缩放因子和顶点坐标可以由求解一个二次能量函数来得到,该二次能量函数的求解只涉及一个稀疏线性系统的计算。该算法可以在图像缩放的过程中保持图像的主体内容包括特征直线和曲线不发生明显的形变。同时可以将该问题转化二次规划问题保证在缩放过程中图像中不出现自相交。一系列实验例子说明本算法非常高效可以达到实时交互的效率,同时有效性和鲁棒性在与现有算法中的比较中略占优势。其次,我们提出了一种数字视频转义表示的方法。我们提出视频骨架的概念:一种有效的视频关键帧提取和视频浏览工具。通过检测和聚类视频中每一帧的特征信息构造视频骨架的高维折线表示,并将其降维到三维空间中显示。通过基于几何度量的迭代折线简化方法构造视频骨架的多分辨率折线表示,在某一确定分辨率下,该折线的各顶点代表了视频的关键帧。用户可以通过视频骨架在不浏览视频的情况下快速得到视频的关键帧信息和视频的内蕴信息,同时用户可以借助视频骨架来代替时间轴以高速、有效地浏览其对应的视频。再次,我们改进了变分网格逼近的求解算法,设计了一种基于贪心算法的高效数字几何网格简化算法。在给定目标网格面片数量的前提下,使用与法向相关的以目标网格近似表示原始网格的误差度量函数。通过离散该误差度量函数,我们提出一种基于局部贪心归并算法以高速求解逼近误差度量极小值问题的算法。同时该算法基于模型的曲率来控制简化多边形网格面片的分布,使得目标简化多边形网格有着更好的质量。该算法具有直观的几何意义,且计算量较小,效率较高,能够有效地应用于几何造型系统中。最后,我们提出一种基于矩阵低秩理论的计算人造物模型直立方向的非监督计算方法。人造物模型通具有遵从于人类视觉和其本质性质唯一的直立方向。我们发现放置在与坐标轴对齐方向的模型投影可以被视作低秩矩阵,由此,我们使用最近提出的TILT算法迭代地旋转模型以期将模型的投影矩阵的秩降到最低,将模型与坐标轴对齐后,模型的直立方向可以通过简单的几何分析从与坐标轴对齐的六个候选方向中遴选出来。该算法不需要额外的模型训练集辅助计算,可以独立执行。一系列实验例子将说明该算法的有效性和直观性。