基于链接分析的Web社区发现研究与应用

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:chongzimm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息资源的急剧膨胀,如何从中抽取出潜在的、有价值的信息,进而充分有效地利用Web信息资源,是当今信息领域重要又极具挑战性的研究课题。而对Web社区发现的研究具有一定的实际应用价值,Web社区是Web组织中非常重要的信息,它可以对互联网信息进行各种意义上的划分,反映Web中普遍存在的、复杂的聚团关系和层次关系。Web页面之间的链接关系为Web社区发现研究提供了极其丰富的信息线索,Web社区发现主要依据的是链接分析技术。从链接结构中获取有用的拓扑关系,可进一步分析其所对应的功能或语义内涵,有效实现无用信息的过滤。将Web社区发现算法应用于搜索引擎中有助于提高Web信息搜索的性能与精确度,并可在一定程度上实现信息的聚类。本文在分析当前Web及其数据特征、Web拓扑结构建模方法、Web拓扑结构模型、信息检索模型及搜索引擎体系结构的基础上,以链接分析技术为支撑,研究了Web社区发现典型算法并提出了改进算法,同时在现有搜索软件及其工具包基础上构建了其应用系统原型。探讨了如何根据Web社区发现算法对Web信息集合进行有效的聚类划分和直观易懂的描述,对改善搜索引擎的搜索结果有一定的理论及应用价值。
其他文献
本文首先讨论了信息家电的特点,提出了信息家电体系结构框架的构想,并就信息家电接口描述语言在整个体系结构中所起的关键作用做了介绍;将面向对象的思想引入信息家电体系结构的
随着信息化进程的推进,在信息检索、模糊物体匹配、数据集成、传感器网络、社交网络等应用领域存在着大量的不确定数据。然而传统的关系数据库只能处理确定的数据,对于概率数
学位
本体作为一种能在语义和知识层次上描述概念的建模工具,可有效地解决知识工程中知识共享和重用两大重点问题。近几年本体已经成为人工智能领域的研究热点,主要研究本体表示、本
深度学习算法正得到越来越广泛的关注和应用,然而随着输入训练数据集和神经网络模型的增大,单节点进行深度学习训练存在内存限制以及训练耗时等问题,分布式深度学习应运而生
软件测试是软件开发过程中保证软件质量、提高软件可靠性、降低软件生产成本的关键技术手段。测试用例的生成是软件测试的一个关键环节,测试用例直接影响了软件测试的效率和覆
客户是电信运营商的战略资源,由于发展一个客户的成本是保持一个客户成本的三到五倍,所以,在大力发展客户的同时,预防现有客户流失越来越受到电信运营商的重视。客户流失分析就是
随着多媒体应用领域的不断拓展和网络通信的日益普及,层出不穷的网络业务,诸如:IP电话、网络会议、视频点播、远程医疗、网络课堂等多媒体应用服务,对互联网络提出了更高的要求。
MD5作为在计算机安全领域常用的哈希函数,其安全性接受着极大的考验。在我国的密码学专家王小云教授提出模减差分攻击有效攻破MD4,MD5,SHA-0等一系列哈希函数之后,MD5攻击取
随着企业之间竞争的加剧,信息快速、准确的传递变得越来越重要了。车间的管理在企业中占据了越来越重要的地位。如何有效地管理车间,使信息能快速有效的传递,已成为信息管理