基于遗传算法的Web信息抽取

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:shuiwadandan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
WHISK系统是一个半自动的IE系统,对结构化、半结构化的Web文本它都能使用生成的抽取规则进行信息抽取.但是它在规则学习过程中规则不能保证以最优的方式进行扩展,且生成规则集的时间较长.文中主要针对这些问题,提出利用遗传算法改进WHISK的监督式学习算法,并采用移除法生成规则集.实验结果表明此方法在效率和召回率上都得到提高. The WHISK system is a semi-automatic IE system that extracts information using the generated extraction rules for structured and semi-structured Web texts, but it does not guarantee that the rules are extended optimally in the rules learning process In order to solve these problems, this paper proposes a supervised learning algorithm that uses genetic algorithm to improve WHISK, and uses the removal method to generate rule sets.The experimental results show that this method is improved in efficiency and recall rate.
其他文献
目的 探讨尿毒症时高磷是否通过局部环氧化酶2( COX2)途径刺激人甲状旁腺细胞增生和功能亢进.方法 收集19例行甲状旁腺切除术的尿毒症患者甲状旁腺组织,通过免疫组化和免疫共
【目的】了解我国某农村地区儿童智力低下的病因,探索在基层开展智力低下(mental retardation,MR)病因诊断的可行性。【方法】对山西省吕梁地区2800个儿童进行智力筛查,MR确
目的: 确定阿维A酸对系统性硬皮病患者皮肤成纤维细胞增殖及分泌转化生长因子β1(TGF-β1)的影响.方法: 原代培养系统性硬皮病(SSc)患者皮肤成纤维细胞(FB),使用不同浓度的阿
在不同地方,不同钙、镁含量水平的菜园土壤进行菜心钙、镁肥田间试验。根据20个试验点的钙肥试验和15个试验点的镁肥试验结果,分别建立菜心相对产量与土壤交换性钙、镁含量的
选用氮素利用高效型和低效型具有代表性的12个粳稻基因型,研究水稻氮素积累、转移特性的差异及其与氮素利用效率的相互关系。结果表明,有效分蘖临界叶龄(N-n)、抽穗和成熟期,
利用微波快速提取洋葱中黄酮类化合物,采用正交实验L9(34),优化实验条件,考察了提取剂浓度、微波提取时间、微波功率、料液比等因素对洋葱中黄酮类化合物提取的影响,确定了微
目的 探讨α7神经型尼古丁受体(nAChR)表达改变与淀粉样蛋白前体蛋白(APP)代谢、细胞存活率及脂质过氧化水平的关系,以了解α7 nAChR的神经保护作用,以及该受体水平与阿尔茨
利用低共熔组成的0.38LiOH " H20-0.62LiN03混合锂盐体系与共沉淀合成的前躯体Ni1/3Co1/3Al1/3 (OH)2简单混合,经三阶段温度烧结制备出锂离子电池正极材料LiNi1/3 CO1/3 A11/
为了克服已有方案安全性依赖强、签名长度长、计算代价大等缺陷,提出了一种可将任意基于身份的具有分割-可模拟的存在性不可伪造的方案转化为强不可伪造签名方案的转化方案;
为达到火电机组节能降耗的目的,以火电机组热经济性分析的统一物理模型和数学模型为基础,借助偏微分理论和梯度算子,建立了主蒸汽温度变化对机组经济性影响的通用强度系数计