云计算在网络爬虫中的应用

来源 :第二十四届全国计算机信息管理学术研讨会 | 被引量 : 0次 | 上传用户:mylook1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据当前在线web信息挖掘系统中网络爬虫采集的信息量的动态变化问题,引入了基于云计算的网络爬虫,利用了云计算易扩展,按需使用的理念,动态控制网络爬虫服务器的数量,并提出了两种数量控制策略,既满足网络信息采集的实时性又提高了计算资源的利用率。通过分析对比验证了引入云计算的网络爬虫在资源利用率提高上的有效性。
其他文献
腈纶污水利用微电解处理技术进行预处理,考察反应时间、pH值、曝气量、硫酸亚铁、聚合氯化铝铁、聚丙烯酰胺的加入量等因素对COD去除率的影响,并得出指导性的结论,对腈纶污水治理有很大帮助。
实验室中标准物质主用于质量控制、仪器校核、实验室之间方法比对。标准物质规范化管理,需从台帐建立、核查参数、核查方法进行,这样才能更好地提高检测数据的准确和可靠性。
本文分析磷酸盐在炉水中的反应机理,以及磷酸盐系统流程及设备特点,提出了日常操作中应注意的事项,保证锅炉水质的合格率。
2009年大庆石化公司化工一厂动力车间脱盐水A系列由固定床工艺改造为浮动床工艺,改造后经济效益显著。本文对改造前装置的缺陷进行了分析,对浮动床工艺原理和改进后装置的特点以及改进后的经济效益进行了充分论述,对其它使用固定床工艺的单位具有一定借鉴和指导意义。
锅炉水质的好坏,直接关系到锅炉安全运行和使用受命,工业锅炉在运行时,由于水质不好,造成受热面结垢,必然降低传热效果,使锅炉热效率下降,燃料消耗量增加。同时水质不好,还会引起锅内汽水共腾,造成蒸汽带水而降低蒸汽品质,不仅影响蒸汽的质量,还会产生管道腐蚀。本文阐述杂质对锅炉的危害,杂质的产生原因及对水质指标的控制办法。
针对MBR处理石化废水造成的膜污染,利用电镜和能谱仪分析微滤膜表面污染物质,并考察了几种化学清洗剂对膜的清洗效果。结果表明:膜丝表面覆盖由有机物、无机物及微生物组成的污染层,主是有机物;单一清洗不能使膜通量完全恢复,酸、碱及络合剂的联合清洗效果最佳,通量恢复率高达96%。并分析了膜污染的原因,为MBR持久有效运行提出了合理建议。
本文对工业循环水中锌离子测定的两种分析方法EDTA滴定法和锌试剂分光光度法进行比较,根据锌离子含量不同的水样,选择不同的方法,减少检测误差,提高分析的准确度。
能源管控中心化验室在与单位内部其它化验室测同一时间、同一采样点的除盐水、阴离子交换器出水、混床出水等纯度较高水的pH时出现了较大的差异,为了解决问题,化验室将4块pH表放在同一化验室内测定同一瓶水样,企图在消除了室间差等客观因素,同时再用同一标准溶液标定4块pH表后。本文介绍了承钢能源管控中心化验室在测定纯水pH时遇到的问题,研究出可以改善和提高测量精度的方法。
随着数字信息资源数量的快速增长,传统的信息检索系统因在用户检索过程中返回与用户检索意图无关的结果而造成检索效率降低的问题日益突出。构建基于用户模型的个性化信息检索系统是解决这一问题的有效手段。本文对个性化系统中用户模型进行简要概述,重点分析评述了个性化信息检索系统中基于向量模型、概率模型和语言模型的用户模型表示方法和构建方法,并展望用户模型研究今后的发展方向。
本文通过对2003-2007年间万方数据中期刊论文数据分析,在原有关键词基础上构建主题词表,在实体识别的基础上,对作者、机构、文档进行了关联分析。通过这种关联分析,发现作者、机构、文档间的潜在联系,为进一步语义检索研究做基础性探讨。