一种并行Web信息采集系统模型

来源 :计算机应用 | 被引量 : 7次 | 上传用户:qinzhen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据国内外在信息采集领域的发展以及并行采集技术的研究,提出了一个基于多线程并行的W eb信息采集结构模型,该模型以线程并行的方式对W eb页面同时采集,实现了全面、高效并且灵活的信息搜集。
其他文献
“互动交流”教学的基本模式结构为:教师启动一学生自学一小组讨论一小组交流一练习评定。这一模式主要体现在师生交流与互动,生生交流与互动,以及教师用可持续发展的眼光看待学
提出一种基于分层多模板匹配的高空间分辨率影像的自动配准方法,并根据不同季相遥感影像的特点提出稳定性模板自动选取的方法和流程,详细描述了基于梯度能量的模板选取方法,以及如何筛选容易受到噪声、动态目标干扰的模板区域,如基于植被覆盖度的方法筛选可能受到植被季相变化的模板。同时,还运用了小波多尺度图像分解和自适应匹配的方法来减小模板匹配中数据计算量和搜索空间。通过模板匹配的精度和最小二乘法对匹配后的模板进
针对最小化加权完工时间的等同和非等同并行多机调度问题,通过一种新的扩展顺序表述方式编码,采用自适应遗传算法来优化。此编码与调度方案一一对应,并且适于用多种交叉算子。计算结果表明,基于该编码方式的自适应遗传算法是有效的,能适用于大规模等同和非等同并行多机调度问题,且算法操作简单,收敛速度快。
<正>勾践卧薪尝胆的故事,是世世代代浙江人实现人生价值的"原型"。"勾践原型"是浙商企业家精神的真正内核,是浙商有别于其他商业群体的地方。他们,在2000年前的战国时期就已
通过对标称数据的分析,提出了一种基于信息熵和层次聚类思想的标称数据聚类算法。算法采用信息熵度量对象之间的相似性,通过数据直接计算相似性阈值。实验证明算法是可行并且有效的。
作为全国食品安全宣传周活动的重要组成部分,“食品安全与科学消费大家谈”主题活动6月25日在京举行。国家工商总局副局长马正其出席活动并致辞。他强调,各级工商部门要依法履
提出了一种基于汇聚流回推的DDoS(DistributedDenialofService)综合防御方案。此方案对本地路由器上的汇聚流及其上游汇聚流回推树上第n层路由器上的汇聚流进行分布限速,以达到抵御DDoS攻击的目的。给出了汇聚流限流算法和回推汇聚流所需的反向汇聚流往返树的构建算法。汇聚流限流算法旨在最大限度地限制DDoS流,同时保护正常的用户流。反向汇聚流往返树的构建算法通过动态地探测高流量的
本研究基于犬细小病毒(canine parvovirus,CPV)VP2基因序列设计引物,利用PCR技术扩增该基因。扩增的VP2基因连入表达载体pET-32a(+),经PCR及双酶切鉴定基因连入正确。重组表达载体
幻想玩家“堕落天狼”打算卖掉他的那只幻想i时代2区极品1级宠物(技能属性精、幻、灵、驱、强),消息在当乐网上发布后,当乐玩家“一帘幽梦”很快以2500元人民币买走。每天许多类
结合通用函数库的特点和正则表达式的优点设计和实现了一套完善、简单、逻辑结构清晰的转换方法和实现代码,该方法不仅保证了最终结果的绝对完全一致,而且解决了因C语言拥有指针类型而存在的数据类型不一致问题,并通过大量测试用例验证了该方法的正确性、有效性和高效性。