【摘 要】
:
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以
【基金项目】
:
国家十一五资助项目(2006BAH02A10);国家863计划资助项目(2008AA01Z421)
论文部分内容阅读
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之前就产生好的标签,在生成了标签的基础上,再进行检索结果聚类。对于搜索引擎返回的结果,我们先统一建立一棵后缀树,然后计算后缀树中各个短语的得分,选取得分最高的若干短语作为候选标签。得到标签后,将搜索引擎返回的各个结果项分配到它所包含的标签对应的分类中,形成最后的聚类。实验表明,我们的方法是比较有效的。
其他文献
医药行业是持续的朝阳行业。2018年1-7月份,统计局给的数据显示,医药行业收入增速和税前利润增速分别为:14%和11.2%,约为GDP增速的两倍,保持稳定增长。在“十三五规划”中,国
以1990年-2015年间戏剧戏曲剧本及其他编剧学史料为研究对象,通过编剧学观念、理论及技法的演变,结合戏剧戏曲界的运动、现象,归纳九十年代、新世纪两个时间段里不同类型的话
本文简要回顾了我院CATIA VPM三维协同设计的发展历程及其特点。较为详细的介绍了以CATIA+VPM协同设计平台以及3DVIA Composer作为工具,以骨架建模思想、参数化建模方法、CAT
本文就当前大学有机化学实验教学过程中容易忽视的几个问题展开,并根据我们的教育实践从教育方法、内容和考查机制等方面提出解决办法,旨在给学生以正确的观念引导,解除对有
分析BP神经网络应用于水质评价中存在的问题和目前水质评价中的不足,基于地表水环境质量分级标准和L-M算法原理,提出LM-BP神经网络水质综合评价通用模型。利用随机内插方法在
为了提高对低频段厘米波的干扰效果,进行了镀铁镍碳纤维的改性研究。利用化学镀法成功将碳纤维表面镀覆一层均匀、致密的铁镍合金。用扫描电子显微镜(SEM、)X-射线粉末衍射(X
目的探究吡喃阿霉素联合大剂量甲氨喋呤治疗淋巴系统恶性肿瘤的效果及对患者炎性因子水平的影响。方法选取我院诊断为淋巴系统恶性肿瘤的60例患者作为研究对象,随机分为两组,
政治课对于提高初中生的思想道德水平,塑造健康的人格具有关键性作用。但有很多学生对政治课并不重视,改变这一现象的重要途径就是激发学生的学习兴趣。只有对政治学科感兴趣
一是“三位一体”沼气利用模式。沼气池与猪舍、厕所相连.与庭院经济相结合,一个沼气池,养3~5头猪,一家人用气.沼渣液可种1-2亩菜或肥3~5亩粮田.这是最普及的模式.与目前农村家庭经营相