基于主动学习的Web页面信息抽取

来源 :情报学报 | 被引量 : 0次 | 上传用户:zst_chengdu_xxxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于主动学习的Web页面信息抽取方法,可以使用户在标记少量具有代表性的样本页面的情况下,有效地提高信息抽取规则的覆盖性,从而使包装器具有一定的自适应性。
其他文献
原发性肝癌(Primary Liver Carcinoma,PLC)是临床上最多见的恶性肿瘤之一,过去开腹手术是主要的手术方法。由于PLC起病隐匿,早期缺乏特异性症状,患者就诊时大多已失去手术切除机会,能手术切除者不足全部PLC患者的25%。近年来,肝癌微创介入治疗得到长足发展和广泛应用,一方面为不能手术切除患者提供一种有效的替代治疗方式;另一方面,由于超过50%的肝癌患者在手术时已经发生肝内转移
飞机供氧系统是保障飞行员生命安全的重要设备,而主动供氧系统是现在供氧系统的发展方向。采用C语言建立了主动供氧系统的仿真模型,主要包括供氧活门设计建模、呼吸面罩各部
快速发展的集成电路制造工艺与相对滞后的设计技术形成的"存储墙"问题已经成为制约限制处理器潜在性能提升的主要障碍,构建高性能片上存储系统一直是处理器微体系结构研究的
本文在确定国内知识管理领域使用频率最高的54个关键词的基础上,运用共词分析法,以SPSS软件为工具,通过因子分析、聚类分析的方法,揭示了国内知识管理领域的十大研究结构:知识形态