基于Web挖掘的信息抽取系统的研究

来源 :铜陵学院学报 | 被引量 : 0次 | 上传用户：tangyanb

【摘要】

：

文章讨论了Web挖掘的一些基本概念,针对Web数据的特点提出了一个基于Web挖掘的信息抽取系统的结构模型。模型通过对XML文档的解析生成DOM树,在此基础上,通过对样本页的DOM树

【作者】

：

方少卿胡学钢

【机构】

：

合肥工业大学,铜陵职业技术学院

【出处】

：

铜陵学院学报

【发表日期】

：

2010年4期

【关键词】

：

WEB挖掘信息抽取抽取规则

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文章讨论了Web挖掘的一些基本概念,针对Web数据的特点提出了一个基于Web挖掘的信息抽取系统的结构模型。模型通过对XML文档的解析生成DOM树,在此基础上,通过对样本页的DOM树的先序遍历生成抽取规则,再以此规则对Web页进行数据抽取,所抽取的数据保存在数据库中,以便利用数据库技术进一步利用这些数据。

其他文献

分子吸附再循环系统成功治疗SARS体会

<正>一种易引起呼吸功能衰竭的急性传染性非典型性肺炎自2002年11月首先在广东省佛山地区发现, 现已蔓延到世界三十几个国家和地区,引起世界卫生组织(WHO)、各国政府以及广大

会议

氧化石墨烯/天然橡胶-丁腈橡胶复合材料的制备与性能

为研究氧化石墨烯(GO)对共混橡胶的补强改性作用,首先,通过改进的Hummers方法制备了GO,并通过乳液共混法制备了GO/天然橡胶(NR)-丁腈橡胶(NBR)复合材料;然后,采用SEM、FTIR、

期刊

氧化石墨烯天然橡胶丁腈橡胶乳液共混力学性能

我院学报主编闵虹教授当选第五届全国社科学报学会常务理事，学报当选理事单位

期刊

首届传统中医腹部诊疗技术学术论坛在京顺利召开

2016年12月3日至5日，“首届传统中医腹部诊疗技术学术论坛暨女性亚健康的非药物调理实用技术专题培训”，在北京大学首钢医院举行。　　本次会议由中国民间中医医药研究开发协会传统中医腹部诊疗分会（以下简称分会）主办，北京大学首钢医院、航天中心医院和北京市石景山区中医医院联合协办。　　数十位国内中医界的知名专家、学者出席了会议，十几位专家做了学术发言。《健康报》、《中国中医药报》、《健康时报》、《健康

期刊

诊疗技术传统中医论坛学术腹部专题培训实用技术药物调理

单侧声带麻痹后不同声带位的临床观察

目的:探讨单侧声带麻痹后的临床特征及声音嘶哑的程度与特点.方法:对45例单侧声带麻痹患者的病因、麻痹后的声带位、声带振动的改变及声音嘶哑程度进行观察和评价.结果:单侧

期刊

声带麻痹声带振动嗓音评价

自动化立体仓库环形2-RGV系统的出库调度优化研究

经济全球迅速发展的同时,智能制造行业在这发展过程中承担起关键性的角色,同时,物料管理相关组成系统研究问题也引起了国内外研究者的格外重视。自动化立体仓库(Automated St

学位

穿梭车调度混合整数规划模型分区法变邻域搜索算法自动化立体仓库

在家里刮痧你得知道这些

常有人抱怨医院挂号难，看病难，一个小毛病常常就在医院耗费了一天时间。有没有一些简单的治疗方法让我们在家里就可以做呢？其实，刮痧就可以。　　刮痧有病缓病痛无病保健康　　皮肤是机体暴露于外的最表浅部分，直接接觸外界，且对外界气候等变化起适应与防卫作用。皮肤之所以具有这些功能，主要依靠机体内卫气的作用。卫气循行于皮肤之中，卫气调和，则“皮肤调柔，腠理致密”。而刮痧疗法作用部位就是在人的体表皮肤，健康

期刊

刮痧自然疗法防病治病保健养生无副作用家庭保健

主题活动:椅子娃娃真好玩(2-3岁)

<正>一、主题背景宝宝每天都会接触到小椅子,特别喜欢玩小椅子。有的把小椅子推着走,有的把小椅子一张一张叠得高高的,有的对椅子上的图案产生了兴趣。因此,我们设计了椅子娃

会议

《金瓶梅词话》中“立东宫”时代探考

从历史事实和<金瓶梅词话>独特的艺术手法等角度入手,结合作品的主旨,可以认定作品中"立东宫"的时代,当指明嘉靖朝而不是指明万历朝.

期刊

《金瓶梅词话》立东宫时代东官册封Jin Ping Mei with Parts in Verse the accreditation of the cr

高压氧与甲基强地松龙对不同系小鼠皮肤移植局部浸润T淋巴细胞及细胞粘附分子表达的影响

期刊

高压氧甲基强地松龙T细胞粘附分子皮肤移植

基于Web挖掘的信息抽取系统的研究

与本文相关的学术论文