基于模糊集的主题提取和层次发现算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:longlivewebdynpro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,提出了一种基于模糊集的主题提取和层次发现算法(FSTH),通过用户日志扩展查询词,构造符合用户需要的个性化根集和基础集合,达到防止主题漂移的目的。FSTH采用模糊集划分方法,层次地发现与用户查询相关的主题页面集合,利用HITS算法分别计算每个主题页面集合中页面的权威值,返回与查询相关的其他主题权威页面。在14个查询上的实验结果表明,与HITS算法相比,FSTH算法不仅可以减少7%~53%的主题漂移
其他文献
户外大型展示牌是会展设计中的重要宣传方式之一,文章从户外大型展示牌的版面设计要求出发,从文字与字体、照片与图像、色彩的对比与调和、黄金比例与白银比例几个方面分析论
针对全局K-Medoids算法在处理大规模数据聚类分析时搜索效率低的问题,提出了基于竞争神经网络的全局K-Medoids聚类算法。由于神经网络算法对输入模式要求为数值向量,不适合处
城市快速轨道交通建设对任何一个城市来说都是巨大的经济负担,然而在适当的地段采用高架形式以节省资金,却常常不为人们所接受,主要在于其对城市环境、景观的影响方面。本文以广
本文通过宏观、中观、微观视角分析高校学生宿舍人际文化的现实特质及成因,从“家”“情”“礼”三重向度构建新时代宿舍人际文化发展新路径:推进空间建设与主体意识的统一,
1断奶仔猪腹泻的主要原因1.1应激因素仔猪断奶后,处于以一应激高度集中时期,如断奶、饥饿、转群、免疫、换料等,其中饥饿、换料应激最严重。大量累加应激,会引起仔猪暂时性营养不
面对电力系统自动化技术的迅速发展对自动化主站端的要求越来越高的现状,很多电网公司开始将D5000系统和PAS软件结合应用。这种应用提高了电力系统的经济效益和安全性,解决了人
数字线划图(DLG)是基础地理信息的核心数据之一,已广泛应用于防震减灾、国民决策、国防建设等各个行业中,DLG数据的质量直接影响着其数字产品在各个部门之中的应用。因此,为D
我国技术物化滞后的原因与对策山东大学经济系孙曰瑶,宋宪华技术物化是指技术由其信息价值状态转换为经济价值状态的过程。换言之,就是由技术发明者到生产者的过程。作为第~生产
近年来,水上交通险情由于其存在人员伤亡、财产损失和环境污染的风险受到国内外学者的关注。目前的研究主要集中在风险评价和事故致因分析,但是对于险情发展过程中应急干预的
微博已成为信息时代优秀的主流自媒体平台,作为网民发布、获取信息的关键桥梁,微博话题与现实社会民情紧密相联。对微博热点事件的检测与分析是网络舆情监测工作的一项重点,