论文部分内容阅读
互联网的快速发展产生了数据量庞大、数据结构复杂和实时处理要求高的Web文本,一般的文本推荐方法依赖于属性计算或关键字匹配,导致推荐结果不理想。为了解决这一问题,本文通过提取用户浏览记录中的网页文本信息,对文本进行特征表示和语义分析,在同类别网页文本中筛选出与用户浏览相似度较高的文本,结合用户对网页文本的兴趣度,将排序结果推荐给用户,完成了智能推荐的研究工作。主要工作包括以下三个方面:(1)本文提出了使用语义感知池化(SAP)的卷积神经网络(CNN)文本模型。其中,语义感知使用了概念层次网络(HNC)理论中句类模式和语义感知处理模块,结合概率上下文无关法(PCFG)进行句类分析,以此改进CNN中的Pooling层来处理卷积后的文本特征。使用改进的模型分别在文本相似度和文本语义分析工作上进行仿真实验,验证了其可行性和优越性。(2)在文本特征表示与计算的基础上,本文使用在传统向量空间模型相关研究中构造的长文本相似度计算方法,计算用户浏览文本与候选集文本的相似度,其中候选集文本是由用户浏览记录和待推荐文本聚类得到的。然后收集用户网页操作行为并计算用户对该网页文本的兴趣度。本文使用将文本相似度模型与用户兴趣模型相结合的方法,计算出前n个相似度与兴趣度的综合评分较高的候选文本作为最终的Web文本推荐列表。本文对给出的Web文本推荐模型进行了实验分析,实验表明该方法能够加快算法收敛速度并降低平均绝对误差。(3)本文将相关的方法进行集成与设计,基于BS框架实现了智能推荐工具,并完成了该工具的工程部署与软件测试,各项功能测试和性能测试均满足基本要求。