网页过滤中文本内容的抽取技术研究

来源 :硅谷 | 被引量 : 0次 | 上传用户：wumoxiao

【摘要】

：

摘要: 研究基于文本内容的网页过滤技术,网页过滤的成效依赖于网页分类的精度,网页分类的准确与否依赖于网页文本内容抽取的效果,即通过分析网页内容,得到网页中的能够代表网页语义的文本信息。提出一种在同一网站中寻找相似网页的算法,它可以克服其他网页内容抽取方法中存在的弱点。　　关键词: 网页过滤;文本分类;文本抽取　　中图分类号:TP3文献标识码:A文章编号:1671-7597(2010)0420064

【作者】

：

赵坤

【出处】

：

硅谷

【发表日期】

：

2010年8期

【关键词】

：

网页过滤文本分类文本抽取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要: 研究基于文本内容的网页过滤技术,网页过滤的成效依赖于网页分类的精度,网页分类的准确与否依赖于网页文本内容抽取的效果,即通过分析网页内容,得到网页中的能够代表网页语义的文本信息。提出一种在同一网站中寻找相似网页的算法,它可以克服其他网页内容抽取方法中存在的弱点。
　　关键词: 网页过滤;文本分类;文本抽取
　　中图分类号:TP3文献标识码:A文章编号:1671-7597(2010)0420064-01

其他文献

吉林省九台市地力现状与主要作物的施肥情况

通过对吉林省九台市土壤养分现状的调查,明确高产作物施肥模式形成的机理,提出适合九台市的施肥模式。 Through the investigation of the present status of soil nutrient

期刊

土壤养分测土施肥农业生产

网络服务器配置仿真教学平台研究

随着网络技术对各个领域的技术应用影响日益深入,也促使着现代仿真技术朝着基于跨网络的大规模分布式仿真方向发展。2006年8月劳动和社会保障部颁布了《关于做好高技能人才相关基础工作的通知》,该通知要求高技能人才培养结构采用标准化实训设备、仿真模拟设备及相关教具开展技能教学和实训。国内教育学者纷纷响应,2009年9月24日-26日中国教育技术协会仿真教育技术专业委员会在大连海事大学召开2009年年会。会

期刊

网络课程服务器配置大规模分布式仿真高技能人才教育技术劳动和社会保障计算机应用教学人才培养结构大连海事大学专业委员会网络技术实训设备模拟设

震荡市赎回基金的五大误区

近期,股市出现了一波震荡调整行情,许多基金的净值纷纷缩水.面对震荡市,一些投资者选择了赎回策略.其实,投资者在选择赎回时应对基金净值的下跌有一个更为清晰的认识,特别是

期刊

基金净值投资者选择震荡调整赎回策略操作策略行情股市

基于知识地图的学习内容管理系统的系统设计

在新一代网络教育应用平台——学习内容管理系统(LCMS)的研究基础上,利用知识地图来构建学习对象(LO)之间的关系,这样不但能很好的表示出学习对象之间的关系,而且有利于学习对象的重复利用和查找。知识地图的构建为数量繁多,关系复杂的学习对象提供了一套构建策略,使学习对象间的条理和脉络更加清晰。旨在为教学设计人员和内容开发人员提供一套构建策略。

期刊

学习内容管理知识地图学习对象

浅谈IPv6环境下的入侵检测

摘要: IPv6协议作为下一代互联网的核心,有效地解决地址短缺问题,并对原有IPv4作了大量的改进,包括增加了安全性、地址自动配置、移动性以及性能提高等。但IPv6环境下的网络攻击依然存在,不仅包括网络中原有的那些针对非IP层的攻击,还包括IPv6引入的新的攻击行为。　　关键词: IPV6;协议;入侵检测　　中图分类号:TP3文献标识码:A文章编号:1671-7597(2010)0420063-0

期刊

IPv6协议入侵检测

TS-1催化剂选择性加氢脱硫性能的研究

期刊

网络中的常见故障诊断及分析

网络故障极为普遍,故障种类也十分繁杂。如果把网络故障的常见故障进行归类查找,那么无疑能够迅速而准确的查找故障根源,解决网络故障。文章主要就网络常见故障的分类诊断进

期刊

网络故障常见故障分类诊断物理类故障逻辑类故障

索贝公司媒资系统拓展广电外市场

期刊

媒资系统广电

阳离子掺杂水滑石的制备和表征

期刊

高强度高伸长率丙烯酸酯橡胶的合成研究

期刊

网页过滤中文本内容的抽取技术研究

其他学术论文