基于查询日志挖掘的网页聚类研究

来源 :第二十二届中国数据库学术会议 | 被引量 : 0次 | 上传用户:peace_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对纯粹采用网页内容的聚类方法,通过对搜索引擎查询日志的挖掘,将查询作为网页的附加特征向量,以迭代的方式逐步修正,极大地提高了网页聚类效果.
其他文献
本文基于自主计算思想,提出一种网络计算抗衰与自愈模型NCASS,该模型利用时间策略嵌套和秘密共享等技术,在监测网络故障的同时,自主更新网络计算的相应性能,从而保障网络计算
“好斗”的周鸿祎,如何一步步绕开自己埋下的“雷区”让360免于作茧自缚,并在夹缝中抢夺地盘?
本文提出了一种利用内容相关的网页(相关实例),自动生成异构网站提取模式或称wrapper的方法:利用全局模式和一个样本网页内容的对应,得到全局模式(GS)与一组相关实例的异构网
本文对推理函数的计算方式进行了改进,并在经典通信模型基础上设计出了推理通道的信息流模型,用以评估推理通道的有效性以及相关参数的计算.
3月1日,新华人寿前任董事长关国亮涉嫌侵占挪用巨资案在北京二中院落判,最终认定其挪用资金额为2亿元,法院判处关国亮有期徒刑6年。此时,关已被羁押4年半。
本文在已有的数据库强制访问控制模型的基础上提出了一种新的数据库强制访问控制模型CMAC,该模型的最低客体粒度为元素,只对敏感属性上的元素作安全标记,同时给出了完整性规
VC基金近二十年前开始在中国投资,行业的投资跨度很大,包括半导体、新能源、消费品、TMT、医疗都曾经是VC投资的一些热点,在每个特定时期,投资人都在寻找可能爆发性成长的行
期刊
CE:此次被双汇国际收购,可谓SFD在国际化方面的重大举措,你们什么时候开始走向国际化道路?rn拉里·波普:1998年我们进入欧洲,那年收购了一家法国公司,几乎同时进入加拿大,还
目前,中国经济处在一个关键的转折点上,要实现可持续增长,中国必须告别过去的增长方式.多年来,中国经济增长的原因与经济风险的恶化的原因相同,两者是同一个增长模式的两个方
面对全球最有吸引力的市场,即使是全球最成功的公司也不得不破例。一向高傲的苹果公司,终于还是低了头。4月1日晚,苹果公司的中文官网上贴出了首席执行官蒂姆·库克署名的道