图像结构化特征表示方法研究及应用

来源 :南京大学 | 被引量 : 0次 | 上传用户:coolsun070279
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何对多媒体数据进行管理、分类和检索是当今计算机视觉领域研究的重要问题,具有广泛的应用价值和迫切的实际需求。有效的图像特征表示是完成上述计算机视觉任务的基础。过去人们主要通过自身的主观感受对图像加工来获取图像的语义内容,计算机所能提取和表示的图像视觉特征往往不能很好的描述图像的高层语义内容,从而出现了底层特征与高层语义之间的“语义鸿沟”问题。图像特征表示方法的研究是解决“语义鸿沟”问题的有效途径,但是现有的图像特征表示仍然存在语义表达能力弱和判别性不足等问题。因此学习具有结构化特性的图像特征表示具有重要的意义。结构化的图像特征表示能够表达图像丰富的语义内容。于是本文设计了一系列方法学习具有结构化特性的图像特征表示,并在图像检索和分类等任务中取得到了成功的应用。本文具体的研究内容如下:首先,提出增强关系矩阵正则化的方法来改进传统的半监督流形学习降维技术。根据基于图嵌入的流形学习所构建的关系矩阵,探索关系矩阵中数据点之间的近邻关系并且对数据点间“近邻之近邻”的关系进行加强,然后利用概率转移矩阵对增强后的关系矩阵正则化,从而在整个数据集中充分地传播数据间的近邻关系。根据关系矩阵建立目标方程并计算投影向量,实现对整个图像数据集的有效降维,生成具有结构化特性的图像特征表示。最后,利用结构化特征表示进行了基于相关反馈的图像检索实验,提高了图像检索的综合性能。其次,根据现有的词袋模型在构建码书过程中所存在的问题,提出了一种结构保持的增量神经网络学习技术,构造了基于图的码书模型,为后续图像特征的编码提供了更加丰富的视觉单词信息。该方法主要通过在线的方式适应性地学习码书模型,并利用神经网络方法寻找视觉单词之间的关联性,在此基础上采用子图抽取的方法对底层特征编码,得到图像结构化的特征表示。最后利用所提方法进行图像语义分类的实验,提升了图像分类的准确度和计算效率。最后,利用一种基于码书结构增强的适应性局部限制线性编码方法以及几何平滑汇合策略学习图像结构化的特征表示。在编码阶段,利用基于封闭簇的快速近似K-means方法初始化码书,并通过码字周围局部特征的分布动态地更新码书,进而基于码字的密度适应性选择编码基,采用局部限制线性编码方法对特征编码;在汇合阶段,基于几何平滑汇合策略实现对编码特征的汇合,充分地利用了局部特征的几何位置信息,避免了图像空间信息的损失。在图像语义分类实验中,利用标准的分类器对汇合特征进行分类,获得了较高的分类准确率,从而验证了算法的有效性。
其他文献
疫情冲击是短期的、总体可控的,服务外包产业发展的内在特质和阶段性特点也决定了,向高技术、高附加值、高品质、高效益升级是大势所趋,必定稳步前行。当前,我国服务外包产业
本文从F.R.利维斯对麦克卢汉媒介研究的影响入手分析,试图厘清这一学界鲜有关注的麦克卢汉的思想源流。文章认为麦克卢汉从实用主义的文学批评、经验主义的评断标准及去精英
走着上班,我把它想作是“在城市的垄上行”。每天清晨,迎着轻风、晨光,我朝单位走去,钢筋水泥筑就的高楼大厦,犹如森林;大街是溪河,穿梭的汽车、自行车是河中的船。我独行在
秋风送爽,片片金黄色的树叶在风中盘旋而下。最爱在秋季的榜晚,散步在南山路上。踩一地瑟瑟作响的落叶,看满眼金黄的梧桐叶在风中飞舞,那是一种怎样的灿烂。也爱在秋天里,邀
目的:探讨慢病毒靶向介导技术沉默P27RF-Rho基因,阐述其对肝癌细胞侵袭性的影响。方法:构建P27RF-Rho RNAi慢病毒。慢病毒感染肝癌细胞BEL7402。实验分为P27RF-Rho-siRNA实验组
受新冠疫情影响,人与人的直接接触受限,家政服务业受较大冲击,行业发展面临挑战,但这也为家政服务提质扩容提供了空间,可以从全流程数字化改造、服务标准规范程度提升、服务
<正> 因为有了男人和女人,这世界才变得更美好。古往今来,有多少文人墨客把最美好的的字眼都送给了女人——“巧笑倩兮,美目盼兮”,那女孩有多可爱;沉鱼落雁、闭月羞花,更是
在不同的工艺参数下对玻璃纤维/聚丙烯纤维(GF/PP)复合纤维织物使用模压成型方式制成层压板,通过正交试验方法,研究模压温度、模压压力、保压时间对复合纤维织物GF/PP复合材