论文部分内容阅读
面对浩如烟海且纷繁复杂的网络多媒体资源,尤其是应用广泛和快速增长的图像资源,人们迫切需要从这些海量网络信息中快速、有效的选择自己感兴趣的知识(图像和文本),并且快速完成知识的识别与理解。因此,如何对这些大规模网络图像资源的语义内容进行有效的表达和组织,使网络用户快速和准确的理解图像的高层语义;并基于图像的语义内容对其进行有效的组织,以利于高效的知识发现已成为网络智能信息领域的一个研究热点。通常情况下,人们获取知识的方式是基于领域/事件的,而如今单个领域/事件的图像资源的规模已经十分庞大,而且还在快速增长。因此本文首先提出了一种面向领域/事件的图像资源高层语义的组织和表达模型,以对图像资源的语义内容进行完整和分层的组织;其次,基于图像资源的互补语义和细节语义关键词,提出了图像资源之间关联权重的计算算法,我们旨在建立图像资源的关联语义链网络,从而辅助网络用户快速的完成知识的识别与理解。本文的具体研究内容如下:1.面向领域/事件的图像资源初始语义表达模型图像资源的初始化语义表示是建立图像资源多层语义标注模型的重要步骤,是图像聚类的基础,好的图像初始化语义表示模型可以提高图像聚类的准确性。本文中,我们首先讨论了4种应用广泛的文本表示模型:向量空间表示模型,非负矩阵分解表示模型,关联语义链网络表示模型和幂级数表示模型;然后在此基础上提出了图像的初始语义表示模型,并在模型中强调了网络事件中时间和地点关键词对图像聚类的重要性;最后对图像表示模型的优缺点进行了分析。2.面向领域/事件的图像语义多层次标注模型目前网络用户获得图像资源的主要方式是搜索引擎,而且在用户搜索图像资源时,图像资源周围一般会有简短的描述信息,它们可能是几个离散的关键词,或者是一段文字描述。图像资源的高层语义信息是非常丰富的,这些图像标注信息无法完成图像资源语义信息的完整描述。本文提出了一种图像资源高层语义的分层组织和表达模型,旨在完成图像高层语义内容的完整、分层和多粒度表达。3.基于互补语义的图像资源关联本文在图像多层语义表达模型的基础上,提出了基于图像互补语义和细节语义的图像关联权重计算方法、用以计算图像资源之间的关联程度,旨在建立图像资源之间的关联语义链网络,辅助网络用户浏览图像资源。