有效的爬行Ajax页面的网络爬行算法

来源 :电子科技大学学报 | 被引量 : 0次 | 上传用户：buyaodiua1

【摘要】

：

Ajax页面的生成和页面导航需要执行客户端的Javascript代码，传统网络爬行算法无法获取Ajax页面全部内容．分析了Aja）（的工作方式，阐述了爬行Ajax网页所面临的主要问题，提出并实现了

【作者】

：

李华波吴礼发赖海光郑成辉黄康宇

【机构】

：

解放军理工大学指挥信息系统学院

【出处】

：

电子科技大学学报

【发表日期】

：

2013年1期

【关键词】

：

AJAX 爬行算法消重策略搜索引擎 Ajax crawling algorithm replicas-detecting policy search eng

【基金项目】

：

江苏省自然科学基金（BK2010132）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Ajax页面的生成和页面导航需要执行客户端的Javascript代码，传统网络爬行算法无法获取Ajax页面全部内容．分析了Aja）（的工作方式，阐述了爬行Ajax网页所面临的主要问题，提出并实现了一种有效爬行Ajax页面的网络爬行算法。该算法可控制客户端浏览器动态生成页面内容和完成页面导航，为爬行过的页面分配标识编号并生成相应静态页面。实验结果表明，提出的算法所爬行的Ajax页面数量明显多于传统方法，同时，采用的双重消重策略可有效减少算法的时间耗费。

其他文献

左向右分流经肺热稀释测量参数的解读：附一例报告

期刊

张孝骞教授和他的小本本

期刊

张孝骞北京协和医院内科医生住院医师毕业生疑难病诊断

新形势下农村流动人口计划生育管理策略

计划生育是我国一项长期的基本国策,而农村流动人口计生管理工作是计划生育工作的重要组成部分,也是目前计划生育工作的难点和突破口.中共中央国务院《关于全面加强人口和计

期刊

新形势农村流动人口计划生育管理策略

靶材密度对射频磁控溅射法制备ITO薄膜性能的影响

以不同密度的氧化锡铟（ITO））靶材为原料，采用射频磁控溅射法，在室温下沉积并经750℃退火，获得了电阻率为1．56×10^-4Ω·cm、可见光透过率为87％的ITO薄膜。对不同密度靶材制

期刊

氧化锡铟(ITO)靶材密度薄膜射频磁控溅射indium tin oxide（ITO） target density film radio frequen

响应曲面法优化微波提取浆枣枣皮多酚工艺的研究

研究了料液比、微波时间、微波功率以及乙醇浓度对浆枣枣皮多酚提取率的影响，采用中心组合设计的方法，建立了二次多项式回归方程的预测模型，优化微波提取多酚工艺参数为：料液比0.

期刊

微波提取多酚响应面microwave extractionpolyphenols response surface

个人形塑到社会改造:恽代英青年职业教育观

恽代英提出“学问职业之一贯”论,从学问讲究实用、学问职业贯通、品格塑成三方面实现个人在职业取向、能力、品格方面的个人形塑;从个人与社会关系角度,主张青年树立改造社

期刊

恽代英职业教育观个人形塑“向上心”

探讨公共图书馆青少年儿童阅读推广工作要点

我国教育事业发展越发强大,对青少年儿童的教育也越来越关注。阅读作为对青少年儿童终身受益的活动更应给予重视,而公共图书馆作为一个衡量国家公共文化体系的标准,责任更加

期刊

公共图书馆青少年儿童阅读推广

人性化管理在护理管理中的作用

开展护理队伍的人性化管理,对稳定护理队伍及提高护理质量起到积极促进意义,也是医院发展的重中之重.同时良好的护理工作对提高医院整体形象也发挥着举足轻重的地位.因此在医

期刊

人性化管理护理管理作用

呼吸系统疾病的致病因子及防御措施

呼吸系统在人的各个系统中是一个非常容易受到感染的系统,而关于呼吸系统的疾病占据着人体疾病的很大一部分.在2006 年,对于全国部分城市和农村关于疾病死亡原因做出的调查,

期刊

呼吸系统疾病致病因子预防措施

责任制带教模式对内镜室护生护理操作能力的影响分析

目的分析责任制带教模式,了解其对内镜室护理操作能力的影响分析。方法选取内镜室护生100名,并将她们随机平均分为实验组和对照组。通过在实验组使用责任带教模式,进而观察两

期刊

责任制带教模式内镜室护生护理操作能力Responsibility teaching modeEndoscope roomNurseNursing ope

有效的爬行Ajax页面的网络爬行算法

与本文相关的学术论文