A Classification Method for Web Information Extraction

来源 :武汉大学自然科学学报(英文版) | 被引量 : 0次 | 上传用户:1igang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web information extraction is viewed as a classification process and a competing classification method is presented to extract Web information directly through classification.Web fragments are represented with three general features and the similarities between fragments are then defined on the bases of these features.Through competitions of fragments for different slots in information templates, the method classifies fragments into slot classes and filters out noise information .Far less annotated samples are needed as compared with rule-based methods and therefore it has a strong portability.Experiments show that the method has good performance and is superior to DOM-based method in information extraction.
其他文献
目的探讨七氟醚后处理减轻大鼠心肌缺血再灌注损伤时线粒体动力相关蛋白(Drp1)与线粒体ATP敏感性钾通道(mito-KATP通道)的关系。方法清洁级健康成年雄性SD大鼠40只,体重220~280 g,采用随机数字表法分为5组(n=8):假手术组(S组)、心肌缺血再灌注组(I/R组)、七氟醚后处理组(S-Post组)、七氟醚后处理+5-羟基癸酸组(S-Post+5-HD组)和七氟醚后处理+二甲基亚砜
This paper analyzed the theory of incremental learning of SVM (support vector machine) and pointed out it is a shortage that the support vector optimization is
期刊
目的评价硬膜外注射右美托咪定复合氢吗啡酮用于剖宫产术后镇痛的效果。方法择期椎管内麻醉下行剖宫产术患者40例,年龄25~35岁,体重65~85 kg,ASA分级Ⅰ或Ⅱ级,采用随机数字表法分为2组(n=20):右美托咪定复合氢吗啡酮组(DH组)和氢吗啡酮组(H组)。胎儿取出后,DH组依次硬膜外注射右美托咪定1 μg/kg、氢吗啡酮0.4 mg,H组依次硬膜外注射生理盐水0.1 ml/kg、氢吗啡酮0.
贫困一直是各个国家关心的重要问题,反贫困也是我国国家政策和社会学界关注的热点问题。习近平主席在2013年提出精准扶贫理念后,指出扶贫要找准路子、摸清方向、脚踏实地、因地
疫情来临,为了做好防控,为了方便居民生活,让住户们在“疫情下”少出门,少一份感染风险,多一层“健康防护墙”,各加油站在做好油品保供的同时,通过开展免费送货上门,全力以赴
期刊
玉屏箫笛制作技艺起源于贵州铜仁市玉屏侗族自治县,有着悠久的制作历史,2006年被列入第一批国家非物质文化遗产名录,是中国驰名商标.铜仁幼儿师范高等专科学校为传承这一文化