基于CSS选择器的深网结果页抽取方法

来源 :北京工商大学学报(自然科学版) | 被引量 : 0次 | 上传用户:ll19870627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于CSS选择器的深网结果页数据抽取方法,用于抽取深网结果页中的数据记录.实验结果表明在大多数情况下,该方法都能准确抽取出页面中的数据记录.
其他文献
设治局制度萌芽于清末光绪年间,其正式的名称是在中华民国建立之后才真正出现的。设治局虽是民国政府为统一全国政治、加强县级政府组织体系建设而在尚不具备设县条件的边疆
目的探讨双源CT低剂量冠状动脉成像在诊断冠心病中的应用价值。方法将我院收治的90例行双源CT(dual source computed tomography,DSCT)检查冠心病患者纳入研究,以数字表法将
<正>胆固醇是人体不可或缺的脂类物质之一,其不仅参与组织细胞膜的形成,而且是合成维生素D、胆汁酸及甾体激素的重要物质[1]。人体内的胆固醇主要与脂蛋白结合而存在,多数是
目的 本文主要探讨上颌前牙埋伏阻生患者应用正畸治疗所取得的效果,分析正畸治疗在上颌前牙埋伏阻生中的应用矫正价值.方法 将2016年6月4日—2017年6月7日间于浙江中医药大学