分类概念语义特征构建技术的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:tangyujia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的普及和快速发展,Web已经成为富含多种信息资源、遍布全球的共享信息仓库,成为人们获取信息的有效手段和重要方式。Web信息门类齐全、数据量庞大,几乎无所不包,然而面对如此庞大的信息海洋,用户关心的只是其中很小的一部分信息,需要提供有效的搜索引擎或信息集成工具,帮助用户快速、准确地找到他所感兴趣的信息。 在海量Web数据空间中,Web信息通常以网站的形式进行组织,各网站设置自己的分类目录以实现信息页面的按类别组织和发布,形成具有分级层次的分类体系结构。然而不同网站进行类别划分时,标准不统一,分类用语不规范,存在明显的语义差异,难以相互兼容、合并,更无法实现多源Web信息的有效集成。因此迫切需要提供一种有效的信息语义理解和规范化描述方式,以解决网站分类语义异构问题。 为解决网站分类信息的语义异构问题,本文从网站Web信息的层次结构和信息语义两个角度分析网站的分类规律,并以此提出网站的分类体系。在分类体系中,将分类概念作为描述Web信息类别的原子节点,通过分类概念的语义特征体现Web信息类别的潜在语义信息,通过分类概念问的层次关系反映网站信息类别间的层次组织结构,从而实现Web信息的统一理解和规范性描述。 以分类体系为核心,为实现Web信息的语义特征描述,本文的研究内容包括,Web数据信息获取及预处理技术,基于类别的Web文本信息特征词抽取技术,基于特征向量的分类概念语义特征构建技术。主要完成页面文本信息下载和HTML标签解析,从Web文本信息中抽取出描述分类概念内容和主题的特征词并计算特征词权重,构建分类概念的语义特征向量以实现其形式化表示,以及语义特征向量的更新以维护特征向量的准确和实时有效等研究工作。
其他文献
近些年来,随着Internet的日益普及,构建基于Web的B/S结构的管理信息系统的需求越来越复杂,同时对系统的稳定性、扩展性和可维护性要求也越来越高,这就给Web应用开发带来了新的挑
无线传感器网络(WSNs)广泛应用于环境监测、交通控制等诸多领域。事件检测作为无线传感器网络的重要应用之一,受到越来越多的重视。然而由于传感器节点具有感知准确性低、硬件
在互联网广泛普及以及宽带网络高速发展的今天,对网络带宽要求较高的网络多媒体技术也发展迅猛,其中流媒体(Streaming Media)视频技术相关开发与应用成为当前的热点之一。然而
个性化推荐是根据用户的偏好和行为特点向用户推荐感兴趣信息的过程。在未来的智能电视系统中,真正的智能视频推荐应该是不需要用户评分动作就能自动、准确地获得用户兴趣、爱
随着Internet上可获得的Web服务的数量急剧增多,如何能够在服务发现基础上,从大量实现相同功能的Web服务中选取出合适的服务进行服务组合已经成为了一个亟待解决的服务选取问题
随着网络技术和Internet的迅速发展,通过Web方式来发布企业应用系统越来越成为时尚,而基于浏览器/服务器(B/S)的应用成为开发者的首选。 不同的Web应用因所属环境不同,具有特
Internet已经成为目前世界上最大的信息资源库,但是网上信息资源纷繁复杂,如何满足人们对快速、准确而全面获耳义信息的要求,已经成为摆在人们面前的一大难题。本文主要探讨了主
无线传感器网络(Wireless Sensor Networks,简称WSNs)是近几年发展起来的新兴信息技术,它集成了传感技术、分布式计算和无线通信技术的发展。WSNs由大量智能传感器节点组成的局域
单片机(MCU)在工业控制和多机通讯领域有着广泛地应用,但研究较多地还是单片机与上位机的通讯以及由多个单片机组成的主从式系统。单片机的通讯是单片机应用的主要难点,通讯涉
本文探讨了软件体系结构的基本内容和目前流行的两种体系结构,并对WEB应用框架技术进行了详细的描述。本文的主要研究工作是设计并实现了一个新的基于WEB技术的业务系统生成