【摘 要】
:
检测网页重要变化,判断页面核心内容是否发生变化,可有效降低数据采集中重复索引的数量,因此,文中提出基于视觉的网页重要变化检测方法,用于检测页面不同语义区域的变化,可将
【机 构】
:
中国科学院计算技术研究所网络数据科学与技术重点实验室,中国科学院大学计算机科学与技术学院
【基金项目】
:
国家重点研究计划项目(No.2017YFC0820404),国家杰出青年科学基金项目(No.61425016),国家自然科学基金重大研究计划项目(No.91746301)资助
论文部分内容阅读
检测网页重要变化,判断页面核心内容是否发生变化,可有效降低数据采集中重复索引的数量,因此,文中提出基于视觉的网页重要变化检测方法,用于检测页面不同语义区域的变化,可将页面压缩表示为一个低维向量.从用户视觉的角度,理解页面不同区块语义重要度的差异.相比现有方法,文中方法独立于基于HTML类基础文档的分析方法,在新媒体,如移动互联网上,也有一定的适用性.实验也验证文中方法的有效性.
其他文献
目的:探讨血清CRP对于5岁以下小儿化脓穿孔性阑尾炎的诊断价值。方法:选取我院2014年1月-2015年1月实施阑尾切除术的患儿154例纳入本次观察,通过组间和组内进行比较,寻找CRP
针对由水库群、航电枢纽、分蓄洪区等组成的赣江中下游复杂防洪系统,以防洪控制断面洪峰削减率最大为目标,建立了赣江中下游防洪系统联合防洪调度模型。以"1961"典型洪水及50
个人数据权不同于保护个人私密的隐私权,亦不同于以与人的主观逻辑思维密切相关的信息为客体的信息权。欧盟通过制定《数据保护指令》来促进欧盟各国间个人数据的自由流通;美
该即将在全国实施的标准规定了测量和计算天然气、天然气代用品及气态的类似流体的压力和温度标准参比条件。标准参比条件主要用于计量交接 ,并将用于描述天然气的气质和数量
资助我省福利机构残疾儿童康复救助项目,是今年6·30广东扶贫济困日活动通过媒体推介的扶贫济困重点项目之一。截至2013年底,我省登记在册的孤儿约4.4万名,其中:养育在公办儿童福
文章探讨了森林幼儿园模式在日本的发展现状,通过研究发现,日本森林幼儿园的发展主要有民间推动政府的发展模式、原有学前教育的模式下逐步过渡到森林模式和重视本土化等三个
目的:探讨肺隐球菌感染HRCT影像特点,提高诊断水平。方法:分析19例经病理证实为肺隐球菌病患者的HRCT图像特征。结果:19例患者HRCT表现为累及单侧肺者11例,双侧肺者8例;累及
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
教室是学生在校学习生活的主要场所,教室环境布置的好坏,直接反映出班级文化建设的质量高低。因此,班主任在进行教室布置时应注意体现以学生为主体、生生参与、常换常新和形