基于新型主题信息量化方法的Web主题信息提取研究术

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:kennshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算.基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采用分治思想,先定位到包含主题信息的区域,后过滤噪音信息.实验证明本文提出的方法能够较好地解决主题信息自动提取存在的信息完整性和准确性的矛盾.
其他文献
【摘要】 当下的地方政府创新处于新的起点上,面临着升级转型,应提高创新的规划性,改进创新的协调性,增强创新的针对性,重视创新的可持续性。  【关键词】 地方政府 创新 消极情绪 【中图分类号】D630.3 【文献标识码】A  地方政府的履职,推动了国家治理绩效的提高  地方政府是中国改革开放事业不断取得新成就的重要力量。中国是一个内外部关系处于快速变革,治理问题层出不穷、复杂多样的大国。在这样的大
In this paper we briefly describe preliminary data from two experiments that we have carried out to investigate the relationship be- tween visual encoding and m
能动性相关蛋白-1(motility-related protein-1,MRP-1/CD9)系四跨膜蛋白超家族(transmembrane 4 superfamily,TM4SF)的重要成员之一,其在细胞中拥有多种重要的功能.TM4SF至少
Researchers have recently turned to eye tracking to study the complex cognitive processes underlying speech production.The pre- sent paper provides a brief over
We review two studies examining task effects on eye guidance during reading.The first study investigated effects of reading perspective on eye behavior in readi
【摘要】 当今快速发展的酒店业与人才供需之间的矛盾已成为一个急需解决的问题,现代酒店的发展迫切需要高素质的人才。为了适应酒店的需要,本文对高校酒店管理本科专业培养方式存在的问题及如何改进进行了一定的研究。  【关键词】 酒店管理;本科专业;培养方式  随着我国旅游业的大力发展,酒店业也得到了迅猛的发展。我国酒店业从1991年开始连续20年保持高速增长,平均增速达到22.1%。2011年,全国住宿餐
This paper analyses some aspects of the eye movement behaviour of readers of Thai and Chinese.The main focus is on readers landing site distributions on words a
目的:在冠心病心力衰竭患者中联合应用曲美他嗪与美托洛尔的治疗效果.方法:在2016年1月-2017年12月期间从我院选取100例患者,分成对照组与观察组各50例,美托洛尔应用于对照组
【摘要】本文主要讲述了数据挖掘的内涵以及作为机器学习,数据仓库,统计学,智能决策等多个学科的交叉学科的特点。  【关键词】数据挖掘 机器学习 数据仓库 统计学 智能决策  20世纪90年代后期,信息技术、计算机以及网络技术迅猛发展,人类社会从此迈进了一个崭新的数字时代。但是,精彩纷呈的数据也带来了利用这些数据的烦恼,怎样才能充分利用这些数据,怎样才能从中得到最有价值的信息,是我们共同的目标和心愿,
摘要:改革开放以来,我国国民经济持续快速增长,人民生活水平显著提高,同时在经济转型的过程中也不可避免地出现了一系列问题,其中收入差距问题成为当前社会关注的焦点。本文研究税收在调节社会成员收入差距方面的失效,通过分析美日的成功经验,进而提出我国在税收调节收入分配上的矫正建议。  关键词:收入分配;个人所得税;财产税;  近年来,我国经济发展突飞猛进,然而在经济高速发展的过程中,却出现了社会成员间收入