基于Python3爬虫获取最新上架图书的实现

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户：zzhang123

【摘要】

：

在大数据时代,利用网络爬虫自动定向采集多网页有用的信息,并将爬取信息储存至数据库,Excel,Word等,可以根据网页历史数据来确定爬虫爬取网页更新信息的周期,大大增加了信息

【作者】

：

吴剑冰

【机构】

：

浙江海洋大学石化与能源工程学院

【出处】

：

电脑编程技巧与维护

【发表日期】

：

2018年04期

【关键词】

：

Python3语言网络爬虫定向爬虫主题爬虫

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在大数据时代,利用网络爬虫自动定向采集多网页有用的信息,并将爬取信息储存至数据库,Excel,Word等,可以根据网页历史数据来确定爬虫爬取网页更新信息的周期,大大增加了信息的更新及时性。基于Python3.5定向爬取当当网最新上架图书,存储图书基本信息到Word文档,并且可对比历史爬取记录,更新新书信息。

其他文献

生物质成型颗粒燃料燃烧特性的试验研究

该文利用热重分析仪对玉米秸秆、木屑、混合木屑三种生物质成型颗粒燃料进行了理论分析,分段比较了三种颗粒燃料的燃烧特点及各段表观活化能和频率因子的热化学动力学参数,分

期刊

生物质颗粒燃料挥发分析出速率燃烧速率

亲水改性聚醚砜纳滤膜及抗污染性能研究

纳滤(NF)是一种新型高效的膜分离技术，在许多工业领域得到了广泛的应用。膜污染问题是制约纳滤技术应用的瓶颈，而抗污染膜的制备是解决膜污染问题的根本途径。本文以提高纳滤膜

学位

纳滤聚醚砜磺化羧基化抗污染性能

针对性护理干预减轻癌症疼痛的效果

目的探讨针对性护理干预在减轻癌症疼痛中的应用效果。方法 60例癌症患者随机分为对照组和观察组,各30例。对照组采用常规护理措施,观察组在对照基础上采用疼痛干预护理措施

期刊

癌症疼痛匹兹堡睡眠质量指数视觉模拟评分法针对性护理

旋风除尘器对生物炭粉的除尘特性

生物炭粉是生物质热解液化工艺的主要副产品之一,其被清除的效果对生物油质量有较大影响。该文以下降管式生物质热解液化装置作为试验平台,试验分析了旋风除尘器对炭粉的除尘

期刊

除尘效率试验热解旋风除尘器

结合结构面统计的侧向岩石压力计算方法

岩体抗剪强度取决于结构面分布及其性质,侧向岩石压力的计算常用岩体等效内摩擦角参数,而边坡规范中岩体等效内摩擦角的取值难以反映实际岩体结构面分布及其性质的影响。为确

期刊

等效内摩擦角结构面模拟RMR地质评价系统支挡结构侧向压力

尿毒症继发性甲状旁腺功能亢进症(SHPT)的超声观测

目的观察尿毒症继发性甲状旁腺功能亢进症（SHPT）的超声诊断价值。方法随机抽取2013年7月~2016年12月赣州市立医院和赣南医学院第三附属医院收治的SHPT患者35例作为X组,另随机

期刊

尿毒症甲状旁腺高频超声

小檗碱用于结直肠癌治疗的研究现状

越来越多的研究证明,天然药物对肿瘤具有一定的治疗作用。小檗碱是从毛茛科黄连根状茎中提取的一种异喹啉生物碱,由于其清热解毒及抗菌等药理学作用而广泛用于临床。近年研究

期刊

小檗碱癌结直肠分子机制

学生学业成绩评价研究思考

随着素质教育深入发展,学生学业成绩评价的方式也应"与时俱进"地作出改变,需改变过去唯"分数"的单一评价方式,构建"以改变学生的学习方式"与"以学生发展"为依据的评价方式。

期刊

素质教育评价方式

互联网连接创新时代,来了!

<正>互联网时代下广泛的连接创新,正在给我们的生活带来越来越多的惊喜变化,而企业正是在这种惊喜的连接中铸就一个又一个互联网奇迹。化腾将腾讯定位为一个可以"连接一切"的

期刊

智能硬件生态链出租车

力帆：花香海内外

<正>如果按年龄给中国自主品牌汽车老总排座次的话,力帆的尹明善无疑是长者辈的首席,而力帆销售公司总经理胡祺则似乎是最年轻的销售老总。这样的老少搭配似乎看起来很不协调

期刊

俄罗斯

基于Python3爬虫获取最新上架图书的实现

与本文相关的学术论文