一种智能网页数据采集系统设计

来源 :电子技术与软件工程 | 被引量 : 3次 | 上传用户:abc262648312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计了一种网页数据采集系统。采集的数据统一保存到系统数据库,系统辅助用户完成常规采集参数的设置,包括访问间隔时间及数据存储方式等。用户对需要采集的数据进行描述,多次训练系统进行数据采集,生成数据识别模型。在目标网页发生变化时,在一定的范围内根据识别模型自动进行修正以适应新的网页结构,减少采集工作的人工干预工作量。
其他文献
将世界制造大国做"强",中国企业应选择模仿创新模式为宜。模仿创新的实现必须以技术转移为基础,在技术模仿的过程中实现技术积累,最终实现再创造。然而,现实技术转移过程中,面
最近在各地報紙書評版上,關於批評『升學指導』之類書籍的文字發表得很多,足見這一類書籍在市場上流行還很廣泛。這一類書籍為什麼今天還會這樣廣泛流行呢?人民日報圖書評論
期刊
利用5次地层倾角测井资料,采用交会图和井径矢量分析技术,建立井径、井径差值、井眼横截面积、井径积分(井眼纵切面积)、井眼容积等多项参数的测井评价方法。4种交会图法显示
通常情况下,产业内和产业外进口中间品对某产业的技术溢出均存在研发强度门槛效应。基于1996-2009年中低技术产业面板数据,论文用非线性动态面板门槛回归方法检验中间品技术溢出的研发强度门槛效应,发现产业外进口中间品(tram)对中国中低技术产业的技术溢出不存在研发强度门槛效应;产业内进口中间品(term)的技术溢出确实存在研发强度的单门槛效应,只有当数值大于0.6%时,研发强度才有利于term的技
十六大以后,我国进入全面建设小康社会,加快推进社会主义现代化的新时期。作为一个拥有13亿人口的发展中国家,人民要富裕、国家要强大,必须发展经济,这是全面建设小康社会的首要任
大数据时代之下,MySQL数据库的运行效率作为关键问题得到了广泛关注。文章首先对于MySQL数据库多线程引擎构架思路进行必要说明,而后进一步结合其多线程引擎框架展开说明,对于加强该领域的认识有着一定的积极意义。
在全球趋势和转型升级的双重压力下,我国制造业正面临严峻的考验,而以创新为核心的创意设计服务正在向制造业渗透和融合.本文探究了国外制造业与创意设计服务融合的现状和趋
民主是一个古老而神圣的字眼,是人类为之奋斗的崇高理想和追求目标。在当今世界,民主化已成为一股不可阻挡的历史潮流。以美国为首的西方国家利用经济全球化的时机,极力推行其资
期刊