【摘 要】
:
Web上的网页正以惊人的速度增长和变化,给传统搜索引擎的效率和质量带来了许多新的问题和挑战.我们迫切需要一种研究方法,能够对搜索引擎收集来的海量网页进行有效的分析,以
【机 构】
:
北京大学计算机科学技术系,中国科学院软件研究所计算机科学重点实验室
【基金项目】
:
中国科学院计算机科学重点实验室基金
论文部分内容阅读
Web上的网页正以惊人的速度增长和变化,给传统搜索引擎的效率和质量带来了许多新的问题和挑战.我们迫切需要一种研究方法,能够对搜索引擎收集来的海量网页进行有效的分析,以便对Web保持完整清晰的认识来指导搜索引擎进行更有效的服务.本文提出一种基于时间、空间和内容的三维Web分析模型,通过它可以对海量的网页数据进行多维度、多层次的分析工作,为我们认识Web提供一种全新的视角.在实验中我们简单地实现了该模型,并通过对3批网页数据进行分析,得到网页变化率、网页空间分布、复制强度大的网页特点等数据,以及Interne
其他文献
通过对食用香精的系统介绍以及其在糖果,饮料,调味料,乳制品和烘焙制品等食品工业中的作用,阐述了作为食品添加剂的食用香精的重要性。
为抨击那些对行业发展造成不利影响的丑陋建筑,促进建筑行业理性发展,2010年11月1日,由畅言网推出的“2010年全国十大丑陋建筑评选”活动正式拉开帷幕,主办方目前已在全国各
知识链与知识管理是密切相关的,对知识链的研究有助于知识管理研究。本文首先分析了Richard和Holsapple等人的知识链模型及其改进模型所存在的一些问题,然后结合知识管理思想和
目的:总结左心室肿瘤的外科治疗经验,以期提高对左心室心脏肿瘤的手术指征、诊断方法和治疗方法的认识。方法:回顾分析2008年1月~2019年1月间中国医学科学院阜外医院心外科完
本文以超文本信息组织为基点,引入了线性力、自由度和导航力三个术语来对超文本信息结构进行分析,通过对它们之间关系的分析,提出了构建超文本信息结构导航应遵循的基本原则.
目的:研究口腔鳞状细胞癌(OSCC)组织中,性别决定区Y框蛋白5(SOX5)及细胞型朊病毒蛋白(PrPc)的表达和临床意义。方法:采用免疫组化法检测94例OSCC组织芯片及30例癌旁组织芯片