分类标签与主题标签区分方法的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:chensiren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0应用的快速发展,标签在描述和搜索网络资源方面发挥着越来越大的作用。用户在发布或收藏网络资源时可以添加标签作为分类信息,形成了社会化标记和大众分类法。由于长久以来标签在应用系统中均作为无语义的字符串使用,社会化标记的性能始终无法得到的显著提升。如何通过分析标签语义以及标签间的关系实现更高级的标签应用是非常值得研究的课题。本文在分析当前社会化标记的特点与问题的基础上,提出区别对待分类标签与主题标签的思想。主题标签仅描述资源单一方面的内容,分类标签则概括资源所有的主题内容。本文对两类标签的区分方法进行了深入的研究。首先构建用于分析标签语义的标签实例关系,通过标签实例集合计算标签关系特征值,引入关联规则挖掘算法提高特征计算效率。其次归纳标签关系类别、构建标签关系特征向量,借助同层关系字典与支持向量机对标签关系进行筛选,提出用于构建标签层次关系的关系组合法以及语义流分析法。最后结合应用需求提出同时具备标签区分与标签补充功能的父概念交集法,实现对分类标签与主题标签的区分。针对上述过程本文进行大量分析对比实验,通过实验结果证明本文提出的标签区分方法的有效性。为了体现分类标签与主题标签在社会化标记中的积极作用,本文设计并实现标签推荐和资源搜索两个应用实例。标签推荐系统可以根据用户输入的主题标签自动为资源添加分类标签,有助于形成更全面的资源描述。资源搜索系统优先通过精确概括资源内容的分类标签查找资源,有利于获得更准确的搜索结果。
其他文献
无线AD HOC网络是一种非集中式的无线网络。它不依赖于预先部署的基础设施,不使用带有接入点的那种集中式网络方式。相反,每个节点都具有路由功能、为其它节点转发数据。数据
当前,全球主要金融市场特别是外汇交易市场已经实现了网络化和计算机化。金融市场每天都在数据库中积累下海量的交易数据。如何利用计算机对这些数据进行有效的分析和研究,并加
伴随着信息时代信息量的膨胀,无论是网络信息、观测数据以及生物信息都存在着大量相似程度很高的数据。然而传统的压缩方法对于这种数据项之间差异量很小的数据没能够利用这
Web服务由于具有良好的封装性、松耦合性和高度的跨平台集成能力等优势,在网络上的应用越来越广泛。但是基于UDDI的服务发布与发现机制,仅提供语法层次的查找和匹配,很难满足
近年来,无线传感器网络(WSN)被认为是本世纪最具有发展前景的信息互联网络,不仅实现了物—物互相连接的信息通信,而且带动了网络智能化发展趋向。因此,研究无线传感器网络的
随着Web的发展,可供用户选择的Web服务越来越多。传统Web服务的组织和管理方法对服务质量缺乏有效支持,用户难以从众多候选服务中按质量选取最佳服务。现有的Web服务QoS (Qua
十九世纪九十年代初,人们开始对多媒体信息检索领域进行探索。其中,基于内容的多媒体信息检索成为了当时该领域上一个新兴的热点课题。同时也成为了计算机视觉领域中一个备受
作为一种重要的且具有代表性的数据结构,图通常可以用来描述不同领域的事物之间的繁杂关系。在信息化时代,快速增长的数据中的不确定性越来越普遍。如何对具有不确定性的图数
无线传感器网络是一种新形式的信息获得与处理的方式,在无线传感器网络中,由于无线传感器网络的分布性、资源有限性等方面的特性,众多的路由协议栈存在安全隐患,所以在无线传
随着传感器节点各方面能力的增强,WSNs(无线传感器网络)各项支撑技术的逐渐成熟,以及WSNs应用背景的迅速拓展,对WSNs的安全性与可靠性需求越来越强。在WSNs中,由于基于密码体