【摘 要】
:
近年来,随着Internet的快速发展,Web为用户提供了大量的网页信息资源,并逐步成为了人们获取信息的主要途径之一。但Web数量及内容的快速增加,使得用户越来越难对网络中信息的
论文部分内容阅读
近年来,随着Internet的快速发展,Web为用户提供了大量的网页信息资源,并逐步成为了人们获取信息的主要途径之一。但Web数量及内容的快速增加,使得用户越来越难对网络中信息的可信程度进行甄别。本文在传统的Web结构挖掘算法PageRank的基础之上,针对如何评估Web信息可信度的问题进行了研究。通过实际考察和具体分析,网页信息可信的影响因素主要有网页之间的交互结构、网页信息主题之间的相关程度以及网页信息的发布时间等。本文综合考虑了上述影响因素,提出了一种基于改进的PageRank的网页信息可信度评估方法。该方法首先考虑了网页间的交互结构,通过分析网页信息所在网页的链接与被链接的数量、对象,建立网页信息自身的交互结构图;然后利用TF-IDF公式将网页信息主题表示成tf ? idf向量的形式,并利用向量余弦距离公式计算网页信息主题间的相关程度,通过分析网页信息主题间的相关程度把最具代表性的网页信息提取出来;此外,本文又考虑到网页信息内容具有不同的发布时间,因而该方法在可信度评估过程中引入了时间衰减函数,利用该函数反映时间这一要素对网页信息可信度的影响。文章最终的评估方法是在加权的交互结构图中计算每个网页信息的可信度。文中将网页信息主题之间的相关程度、网页信息的发布时间等相关因素引入到网页信息的交互结构图中,利用信任传播机制在交互结构图中维护节点的可信度,达到了一个结点的可信度改变后,其他相关结点都随之动态改变的目的。通过具体实验对本文提出方法进行了验证,实验结果表明基于改进的PageRank的网页信息可信度评估方法能够为用户提供更为可信的、有价值的网页信息。
其他文献
由于年代久远等原因,相当多的青铜器出土时存在破损情况,利用计算机辅助碎片虚拟拼接是青铜器文物修复保护和数字化处理的关键技术之一。针对青铜器具有非刚体性,且碎片的结
随着计算机技术的不断发展,企业信息化成为增强企业竞争力的主要手段。企业部门之间的联系更加紧密,各部门的数据资源已不再归各部门自己独有,而是作为企业中的共享数据资源存在
随着Internet和机器人技术的飞速发展,将Internet作为操作者和机器人之间的数据传输媒介,建立了Internet环境下的机器人遥操作平台,增强了遥操作机器人系统的开发性和灵活性
当今社会是互联网高速发展的时代,互联网科技日新月异,互联网应用层出不穷。从以前的资源缺乏到如今的资源过载,困扰用户的问题已经由从前的资源不足转变为如何从纷繁复杂的
气液两相反应体系广泛存在于过程工程的诸多领域,是一典型的复杂系统,其中气泡聚并、破碎动态演化行为,对反应器的传质传热效率有着重要影响,进而影响整个反应器的性能,因此,
随着网络和计算机技术的迅速发展,人们希望能在任何时间、任何地点、访问任何数据的需求已逐渐成为现实,嵌入式信息系统正在走出传统的机房与桌面,帮助用户随时随地获取相关
人脸超分辨率重构是将低分辨率人脸图像重构为高分辨率图像的技术,该技术在公安、监控与电子商务等系统中具有重要的实际意义。尺度低于24(24×24)像素的超低分辨率人脸图像信息
随着社会现代化水平的提高,快速准确的身份识别技术逐渐成为研究热点之一。颅骨是一种新兴的生物特征,一经提出就备受关注,其突出优点是不受表情干扰和光线约束。作为颅骨应用领
在用户界面研究中,人机交互技术是当前发展最迅速的技术之一,研究人员予以特别重视。它是一门综合学科,与认知学、人机工程学、心理学等学科领域有着密切的联系。作为人机交
随着信息技术的快速发展,计算机应用日益广泛,软件已渗透到国民经济和国防建设的各个领域。但是软件的生产现状和质量常常存在缺陷。因此,如何提高软件的质量,尤其在一些安全关键