网页过滤中文本内容的抽取技术研究

来源 :硅谷 | 被引量 : 0次 | 上传用户:wumoxiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要: 研究基于文本内容的网页过滤技术,网页过滤的成效依赖于网页分类的精度,网页分类的准确与否依赖于网页文本内容抽取的效果,即通过分析网页内容,得到网页中的能够代表网页语义的文本信息。提出一种在同一网站中寻找相似网页的算法,它可以克服其他网页内容抽取方法中存在的弱点。
  关键词: 网页过滤;文本分类;文本抽取
  中图分类号:TP3文献标识码:A文章编号:1671-7597(2010)0420064-01
其他文献
通过对吉林省九台市土壤养分现状的调查,明确高产作物施肥模式形成的机理,提出适合九台市的施肥模式。 Through the investigation of the present status of soil nutrient
随着网络技术对各个领域的技术应用影响日益深入,也促使着现代仿真技术朝着基于跨网络的大规模分布式仿真方向发展。2006年8月劳动和社会保障部颁布了《关于做好高技能人才相关基础工作的通知》,该通知要求高技能人才培养结构采用标准化实训设备、仿真模拟设备及相关教具开展技能教学和实训。国内教育学者纷纷响应,2009年9月24日-26日中国教育技术协会仿真教育技术专业委员会在大连海事大学召开2009年年会。会
近期,股市出现了一波震荡调整行情,许多基金的净值纷纷缩水.面对震荡市,一些投资者选择了赎回策略.其实,投资者在选择赎回时应对基金净值的下跌有一个更为清晰的认识,特别是
在新一代网络教育应用平台——学习内容管理系统(LCMS)的研究基础上,利用知识地图来构建学习对象(LO)之间的关系,这样不但能很好的表示出学习对象之间的关系,而且有利于学习对象的重复利用和查找。知识地图的构建为数量繁多,关系复杂的学习对象提供了一套构建策略,使学习对象间的条理和脉络更加清晰。旨在为教学设计人员和内容开发人员提供一套构建策略。
摘要: IPv6协议作为下一代互联网的核心,有效地解决地址短缺问题,并对原有IPv4作了大量的改进,包括增加了安全性、地址自动配置、移动性以及性能提高等。但IPv6环境下的网络攻击依然存在,不仅包括网络中原有的那些针对非IP层的攻击,还包括IPv6引入的新的攻击行为。  关键词: IPV6;协议;入侵检测  中图分类号:TP3文献标识码:A文章编号:1671-7597(2010)0420063-0
期刊
网络故障极为普遍,故障种类也十分繁杂。如果把网络故障的常见故障进行归类查找,那么无疑能够迅速而准确的查找故障根源,解决网络故障。文章主要就网络常见故障的分类诊断进
期刊
期刊