一种改进的基于本体的Web信息抽取

来源 :计算机工程 | 被引量 : 0次 | 上传用户：su18tt

【摘要】

：

以Web页面信息项本体定义为基础，对单个样本页面信息项路径进行启发式学习，对所有样本页面集中信息块路径进行归纳学习，识别结构相似的信息块子树位置，以准确划定信息抽取区域，降

【作者】

：

柳佳刚陈山黄樱

【机构】

：

湖南工学院计算机科学系

【出处】

：

计算机工程

【发表日期】

：

2010年4期

【关键词】

：

信息抽取本体归纳学习文档对象模型 information extraction ontology inductive learning Document

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

以Web页面信息项本体定义为基础，对单个样本页面信息项路径进行启发式学习，对所有样本页面集中信息块路径进行归纳学习，识别结构相似的信息块子树位置，以准确划定信息抽取区域，降低页面噪声。将经过噪声处理的样本页面自动解析成页面的结构本体。比较Web页面信息项本体和页面的结构本体，通过归纳学习算法生成抽取规则，提高Web信息的抽准率。

其他文献

让办公室“变绿”

办公室可能已经成为除了家以外，第二个长时间驻留的场所。为了更健康、更精力充沛地工作，我们可以把办公室“变绿”!

期刊

办公室变绿场所

雷电波在屏蔽线缆中的传输特性研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

波导理论屏蔽线缆开关型电涌保护器雷电流高次模

浅议建设工程投标报价策略与技巧

期刊

工程投标技巧

醇类燃料的发展及在我国的应用（下）

(续上期)4国外醇类燃料的历史、现状及发展趋势4.1巴西推广乙醇燃料的经验巴西是石油资源贫乏国家之一,早在20年代巴西就开始在汽车中应用乙醇/汽油混合燃料.第二次世界大战

期刊

醇类燃料乙醇/汽油混合燃料空气清净法汽车

襄州茶史之初探

古襄州（也称襄阳）即现在襄樊市，地处鄂西北，长江最大的支流汉江穿境而过，现辖襄阳、襄城、樊城3个市辖区及南漳、保康、谷城和枣阳、老河口、宜城6县（市），总面积1．98万km^2。西部为荆

期刊

茶史低山丘陵区冲积平原南部地区汉水流域武当山桐柏山襄樊市

白介素7及其受体的生理功能与免疫重建

期刊

白介素7免疫重建骨髓移植人类免疫缺陷病毒

微小区MIMO信道模型的相关性分析

根据微小区双散射的MIMO椭圆信道模型，分析发送、接收端阵元天线间的信道相关性，考虑到发射端与接收端周围存在大量散射体，且散射体服从非均匀分布，采用VonMises分布函数描述散射

期刊

微小区多输入多输出相关性信道模型micro-cell Multiple Input and Multiple Output（MIMO） correlat

浅析建设工程投标报价的策略与技巧

期刊

建设工程投标报价策略技巧

天津市创建节水型社会分析及对策初探

1天津市水资源现状1.1水资源短缺天津市是水资源严重匮乏的城市,人均占有水资源量约为160m3,为全国人均占有水资源量的1/15,加上引滦、引黄等外调水源,人均占有水资源量约为3

期刊

天津水资源利用社会分析地面沉降非常规水开发工业节水农业节水

浅谈如何改进传统语文课文教学方式

摘要：又一轮教改即将袭来，这是高考的指向，更是社会发展和时代所需。每一次的语文新改革也总是引发社会的各种质疑或者期待，有的质疑持而久之，有的期待总还是期待。改革本就不是一蹴而就的事情，改也并非完全去颠覆以往的教材，语文的改革更是如此。一线的教师大可不必为此愁眉苦脸，相信许多经典的传统课文还在，深挖教材，让传统课文重新焕发光彩，随时代脉搏跳动才是我们教学的责任。　　关键词：中学；传统课文；时代脉搏

期刊

中学传统课文时代脉搏

一种改进的基于本体的Web信息抽取

与本文相关的学术论文