网页特征相关论文
随着大数据的发展,互联网数据呈现爆炸式的增长。Web作为一种重要的信息载体,包含了各种类型的信息,而包装器的提出就是为了从杂乱......
信息技术的高速发展,丰富了人们的生活,满足人们的各种需求,然而在带来便利的同时也使得网页越来越复杂,催生了众多恶意网页。恶意......
移动互联网的发展速度极大地超出了人们的想象,深刻地改变了个人、企业、政府等的行为和习惯,而智能手机的发展在整个移动互联网大......
随着企业信息化建设的发展,企业信息资源日趋丰富,企业信息门户网站逐渐成为企业信息管理的重要平台,为了促进企业内部的信息共享......
Internet 技术的发展为人们提供了方便快捷的信息获取手段。面对网络上的海量信息,人们有时往往会感到无所适从。如何为每个用户提......
互联网的迅猛发展带动了网络应用的快速增长,互联网为用户提供了种类繁多的网络业务,并不断满足网络用户的各种需求。每天都会产生......
专家实体主页识别是专家检索的一个重要的组成部分,本文提出了一种基于J48的机器学习算法来对中文专家实体主页进行分类识别。首先......
基于源网页的信息比目标网页的更具有区别性,提出通过提取源网页扩展的锚文本,进行目标网页特征识别。分析了不同位置的扩展锚文本......
为了对用户访问过并感兴趣的网页进行准确描述,分析了对网页特征描述中涉及到的特征抽取范围以及特征词权重计算方法。根据"主题相......
本文以学术网页的识别与检索为目标,调查分析学术网页的网页特征。并以非学术文献网页作为参照,对网页特征抽取,验证所发现特征的......
为构建网页内容自动过滤系统,封锁色情网页,通过统计和分析,本文提出采取色情网页特征提取技术是十分有效的手段。据调查表明,与色......
互联网上免费的中文学术资源数量庞大,但实用的专门检索工具仍然或缺。文章以网络中文学术文献的识别与检索为目标,调查分析网络学......
随着互联网的快速发展,钓鱼网站的泛滥让网民们的网络安全受到了严重威胁,导致大量网民泄露了个人隐私与经济上的损失.因互联网不......
网络使用挖掘是通过分析记录在Web服务器上的用户使用数据,来自动发现用户访问信息网的方式.其挖掘结果可以用于改善网站设计、商......
如何快速有效地计算网页的相似性是发现钓鱼网页的关键.现有的钓鱼网页检测方法在检测效果上依然存在较大的提升空间.文中提出基于......
随着电子商务和在线交易的增加,网络钓鱼已经成为最严重的一种网络犯罪形式。文章从网页中包含的超链接这一角度出发,给出了网页的......
随着Web信息的爆炸性增长,如何快速、准确地从浩瀚的信息资源中寻找到所需信息已经成为困扰人们的一大问题。Web信息采集系统就是......