【摘 要】
:
文本推荐是指当用户确定兴趣模型后,系统能对比、判断目标文本与用户兴趣模型的相似程度,并按照相似度由大到小的次序向用户推荐所需文本。常用的文本推荐方法是基于文本向量
论文部分内容阅读
文本推荐是指当用户确定兴趣模型后,系统能对比、判断目标文本与用户兴趣模型的相似程度,并按照相似度由大到小的次序向用户推荐所需文本。常用的文本推荐方法是基于文本向量空间中的特征词字面形式上的严格匹配。在目标文本的特征词集合与用户兴趣模型的特征词集合中,相同特征词的个数越多,目标文本与用户兴趣模型就越相似,它被系统推荐的优先级就越高;相同特征词的个数越少,目标文本与用户兴趣模型就越不相似,它被系统推荐的优先级就越低。但由于自然语言的灵活性,不同的文本对同一事物的描述可能会使用意义相同的同义词。如果在文本推荐的过程中,仅仅考虑特征词字面形式上的匹配,而不考虑同义词匹配,必然出现推荐结果单一、覆盖不全面、准确率不高的问题,从而无法实现向用户准确推荐其所需文本的目的。本文首先对目前的文本推荐方法进行了学习和分析,重点研究了数值型向量空间模型。其次,本文提出了一种基于同义词的文本推荐的改进方法。该方法既考虑特征词字面匹配,同时又考虑同义词语义匹配对文本推荐的积极作用。这样,文本推荐过程就不再只是简单的字面匹配,而是一种语义的匹配。这可以在一定程度上提高文本推荐的精度。通过对实验结果的分析可知,这种改进方法可以更加准确地向用户推荐所需的文本,正确率最高可提高40%。最后,将链路预测方法运用到同义词网络中,利用复杂网络的思想,将同义词构建成网络,然后进行链路预测,预测出目前同义词网络中没有的但确实含有同义词关系的新的同义词对。然后将这部分新的同义词关系与已有同义词关系进行合并,使网络中单词之间的同义词关系更加丰富。新预测出的同义词对使得整个同义词网络的覆盖范围更加广泛。在文本推荐过程中,用户兴趣模型与目标文本同时出现新的同义词关系时,继续使用合并后的同义词网络,可以进一步提高文本推荐的性能。
其他文献
阵列波导光栅(AWG)解调系统是一种新型光纤光栅(FBG)解调系统,实现该解调系统的微型化、紧凑化成为重要的研究方向。传统的FBG解调用AWG体积较大,无法实现微系统集成,但是采用SO
Wi-Fi技术给人们的工作和生活带来了很多方便,发挥着越来越重要的作用。而目前主流的Wi-Fi设备工作在2.4 GHz频段,该频段已经相对拥挤,周围设备使用较多时,容易出现信号干扰
在雷达信号处理与射频段信号谱分析中,光谱烧孔技术因烧孔晶体所据有的高达数十GHz的非均匀展宽线宽和几百KHz的均匀展宽线宽等特性,弥补了传统电学处理射频信号的不足,从而成为目前研究的热点问题。本文研究了基于光学Bloch方程的Tm3+: YAG晶体的光谱烧孔特性。具体包括:晶体材料的厚度对烧孔孔深的影响、激光写入光强对烧孔的孔深和孔宽的影响。本文主要研究内容及创新点包括:1.建立了晶体厚度在低温环
IEEE802.15.4是针对低成本、低功耗、低传输速率的无线自组网设计的协议,它定义了介质访问控制层(Media Access Control, MAC)和物理层的规范。此标准自推出,就被认为是适合
数字音频水印和数字签名现如今已经被广泛应用于取证领域,但是这两种技术在使用时需要借助于预先处理的信息,因此在许多实际应用场合,由于无法实现取证而限制了它们的适用范围。
互联网已成为一个重要的信息和资源共享平台,互联网用户不仅可以在网上处理各种事务,还可以在网上搜索自己想要的信息。给定一个具体的查询,搜索引擎会根据自己的排名机制对
近些年,视网膜血管分割技术在当前临床医学中进行筛查、诊断具有重要的作用。眼底视网膜血管是人体全身血管系统中唯一可以直接观察到的较深层微血管,对其形态结构的观察,不仅可
立体图像已逐渐成为国内外相关领域的研究热点,其应用前景非常广泛,可以用于3DTV、自由视点TV(Free viewpoint TV)、3D照相机、3D电影、3D家庭影院、电脑游戏、电脑绘图、运动、
认知无线电是一种智能的无线通信技术,可以有效地解决频谱共享问题。本文在深入研究认识无线电技术的基础上,重点探讨了其关键技术之一的频谱感知技术,并完成以下创新性研究
随着移动终端数目的快速增加以及移动互联网业务的蓬勃发展,用户对移动通信网络的服务速率要求提高。多用户多天线技术能够充分利用空域资源,是提高移动通信网路速率的重要手