基于URL类型优先级的入口页面查询算法

来源 :山东大学学报(理学版) | 被引量 : 0次 | 上传用户：lyd936

【摘要】

：

入口页面（主页）查询结果只有一个，并且用户的查询词常常是简短的页面名称，由于它要求更高的精准度，一般认为是较为困难的．依据语言模型分析，挖掘出对中文入口页面（entry page）检索有意

【作者】

：

胡俊刚董守斌陈晓志张元丰

【机构】

：

华南理工大学广东省计算机网络重点实验室

【出处】

：

山东大学学报(理学版)

【发表日期】

：

2006年3期

【关键词】

：

入口页面检索 URL类型优先级信息检索 Entry page retrieval URL-type priority information retrieva

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

入口页面（主页）查询结果只有一个，并且用户的查询词常常是简短的页面名称，由于它要求更高的精准度，一般认为是较为困难的．依据语言模型分析，挖掘出对中文入口页面（entry page）检索有意义的查询域作为基准检索的内容域．同时考虑到非内容网页优先级（URI，type等）特征的重要性，建立综合内容域和非内容网页特征的检索模型，通过URL类型优先级（URL-type prior）的概率统计，发现入口页面和其相关的子页面之间存在比较大的联系．据此提出基于相关子页面的入口页面提取算法PERS（page extrac

其他文献

不可压混溶驱动问题的差分流线扩散——混合元数值方法

提出了解不可压缩两相混溶驱动问题的一种新的数值方法,压力方程用混合有限元求解,浓度方程用差分流线扩散方法求解.在空间方向采用SD方法离散.对时间方向进行差分离散(如Eul

期刊

不可压混溶驱动问题差分流线扩散方法混合元数值方法差分离散L^2-模混合有限miscible displacementmixed finite ele

Novolen工艺聚丙烯细粉产生原因及改进措施

介绍了聚丙烯（ PP）细粉过多对循环气系统、载气系统、粉料输送系统的影响，主要从催化剂、生产负荷、开停车、切换产品牌号、丙烯质量等方面分析产生过多细粉的原因，提出相应改进

期刊

聚丙烯细粉催化剂

多目标规划的Johri对偶形式

通过约束集合和目标函数的改变构造单目标规划的对偶规划,利用多目标与单目标规划的关系,构造多目标规划的Johri对偶形式,证明了对偶定理.

期刊

多目标规划弱有效解约束集目标控制函数multi-objective programPareto weak solutionstrict setobjec

浅谈学校体育教学中的心理健康教育

世界卫生组织提出“健康不仅是指身体没有疾病，而且是身体上，心理上和社会上的完好状态。“由此可见，健康仅包含着身心两个方面。过去那种重身体，轻心理的体育教学观念是不全面的

期刊

学校体育教学心理健康

矿用电气开关的芯体结构的改进

为了维修方便及减少对煤矿生产的影响。对400A馈电开关的芯体结构进行了改进。现就改进的前后作一下比较分析。

期刊

芯体结构比较分析插接式结构core construction compurision analysis pinboard construction

氯化镧对口腔内8种细菌及3种真菌的抑制作用

目的:研究氯化镧对口腔常见致病细菌及真菌的抑制作用,观察氯化镧与口腔常用抗菌药物联合应用的效果及其对内毒素的作用,探讨氯化镧抑制革兰氏阴性菌的机制。初步了解氯化镧

会议

带有随机干扰的经典风险过程下的破产时罚金折现期望

当风险模型为带有随机干扰的经典风险过程时,破产时罚金折现期望函数Φ(u,w)及其分解表达式Фd(u)和Φs(u,w)的积分表达被得到,并且它们的二次连续可微性也得到证明.所有这些

期刊

二次连续可微性破产时罚金折现期望破产时赤字破产概率twice-continuous differentiability the expected dis

基于URL类型优先级的入口页面查询算法

其他学术论文