基于Python的电商书籍数据爬虫研究

来源 :北京印刷学院学报 | 被引量 : 0次 | 上传用户：taicangliliang

【摘要】

：

随着互联网的迅速发展,电商已经成为人们主要的日常消费渠道。以购买计算机相关书籍为例,清楚了解众多种类书籍的相关信息成为一种需求。为解决这种需求进行了一种基于Python

【作者】

：

晋振杰曹少中项宏峰王明道李新佩

【机构】

：

高端印刷设备信号与信息处理北京市重点实验室、北京印刷学院

【出处】

：

北京印刷学院学报

【发表日期】

：

2018年03期

【关键词】

：

电商书籍爬虫 Python Scrapy框架

【基金项目】

：

国家自然基金(61472461);国家重大科学仪器设备开发专项(2013YQ140517)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的迅速发展,电商已经成为人们主要的日常消费渠道。以购买计算机相关书籍为例,清楚了解众多种类书籍的相关信息成为一种需求。为解决这种需求进行了一种基于Python语言Scrapy爬虫框架的模拟登陆浏览器和网页解析技术的研究,将获取的电商书籍信息存入Mongo DB数据库或者本地硬盘以便后续进行数据分析。所实现的爬虫程序编程简单、性能稳定,能有效获取电商书籍数据。

其他文献

手机AR小应用的背后 AR识别跟踪技术解密

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

APP关键帧特征点检测

阻塞性睡眠呼吸暂停低通气综合征与内分泌疾病

期刊

OSAHS患病率阻塞性睡眠呼吸暂停低通气综合征内分泌疾病肢端肥大症

陕西工业园区融入“一带一路”战略——现状、方向与路径

<正>推进工业园区融入"一带一路"建设,既是陕西工业园区转型发展的难得机遇,也是落实"一带一路"战略的重要组成部分。陕西工业园区融入"一带一路"的基本方向可概括为"内部提

期刊

工业园区“走出去”“一带一路”建设“一带一路”战略

公共财政体制下非经营性资产管理研究

当前对于非經营性国有资产的管理还处于探索阶段，针对我国非经营性国有资产管理中出现的各种问题各地都结合实际采取了各种不同的监管模式。本文利用比较分析方法和归纳法，通过对我国当前具有代表性的几种监管模式研究，拟提出非经营性国有资产管理体制改革的几点建议。　　一、非经营性国有资产特点　　非经营性国有资产虽然不直接参与物质财富的生产经营活动，但同样创造重要的社会效益，在保证整个社会系统运转中起着重要作用，

期刊

火了稀有珠宝拍出多个纪录

每年秋季的两个最大亮点一个在秀场,另一个就在拍场,作为财产配置的典型项目,珠宝翡翠一直是深入人心的。为何高端珠宝如此昂贵?品牌的知名度、复杂的工艺及优质的宝石均让人

期刊

佳士得成交额钻石戒指克什米尔蓝宝石成交价格帕尔玛安托瓦内特钻石项链皇室贵族天然珍珠

系统护理干预在支气管动脉栓塞咯血患者中的应用

目的：探讨系统护理干预在支气管动脉栓塞咯血患者中的应用效果。方法：将80例行支气管动脉栓塞治疗咯血患者随机分为观察组和对照组各40例,对照组实施常规护理,观察组给予系统护

期刊

支气管动脉栓塞咯血护理

河南新郑大枣中元素含量与产区土壤地球化学关系研究

新郑大枣种植区位于河南省中部黄淮平原区西侧,表层土壤以全新统灰黄色亚砂土为主,为冲积-风积堆积物。深部为更新统亚粘土层,为坡积-洪积物。为了查明大枣种植区土壤中的地球化学元素与新郑大枣中元素含量的关联特征,在开展农业地质调查时,在大枣种植区采集了表层土壤样、浅表层土壤样、土壤有效态样和植物样品,分别进行了多种元素分析。查明表层土壤中富K_2O、Na_2O、SiO_2,浅表层与表层土壤地球化学特征基

期刊

新郑大枣土壤地球化学表层土壤元素含量河南Xinzheng jujubesoil geochemistrysurface soilelement con

2020年何梁何利基金科学与技术奖揭晓

11月3日，2020年度何梁何利基金获奖科学家揭晓。国家呼吸系统疾病临床医学研究中心钟南山院士和敦煌研究院名誉院长樊锦诗研究员获“科学与技术成就奖”。另有30位和20位科技工作者荣获“科学与技术进步奖”和“科学与技术创新奖”。　　国家呼吸系统疾病临床医学研究中心钟南山院士是我国呼吸疾病研究领域的领军人物，敢医敢言、勇于担当。他毕生致力于重大呼吸道传染病等防治研究，取得丰硕成果；他牵头建立的新发特发

期刊

何梁何利基金科技工作者呼吸系统疾病呼吸道传染病敦煌研究院临床医学研究科学与技术名誉院长

基于Python的电商书籍数据爬虫研究

与本文相关的学术论文