基于浏览记录的文本挖掘与智能推荐研究与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户：wintry5

【摘要】

：

互联网的快速发展产生了数据量庞大、数据结构复杂和实时处理要求高的Web文本,一般的文本推荐方法依赖于属性计算或关键字匹配,导致推荐结果不理想。为了解决这一问题,本文通

【作者】

：

王凯

【出处】

：

西北大学

【发表日期】

：

2017年期

【关键词】

：

Web文本词向量 CNN模型文本相似度智能推荐

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

互联网的快速发展产生了数据量庞大、数据结构复杂和实时处理要求高的Web文本,一般的文本推荐方法依赖于属性计算或关键字匹配,导致推荐结果不理想。为了解决这一问题,本文通过提取用户浏览记录中的网页文本信息,对文本进行特征表示和语义分析,在同类别网页文本中筛选出与用户浏览相似度较高的文本,结合用户对网页文本的兴趣度,将排序结果推荐给用户,完成了智能推荐的研究工作。主要工作包括以下三个方面:(1)本文提出了使用语义感知池化(SAP)的卷积神经网络(CNN)文本模型。其中,语义感知使用了概念层次网络(HNC)理论中句类模式和语义感知处理模块,结合概率上下文无关法(PCFG)进行句类分析,以此改进CNN中的Pooling层来处理卷积后的文本特征。使用改进的模型分别在文本相似度和文本语义分析工作上进行仿真实验,验证了其可行性和优越性。(2)在文本特征表示与计算的基础上,本文使用在传统向量空间模型相关研究中构造的长文本相似度计算方法,计算用户浏览文本与候选集文本的相似度,其中候选集文本是由用户浏览记录和待推荐文本聚类得到的。然后收集用户网页操作行为并计算用户对该网页文本的兴趣度。本文使用将文本相似度模型与用户兴趣模型相结合的方法,计算出前n个相似度与兴趣度的综合评分较高的候选文本作为最终的Web文本推荐列表。本文对给出的Web文本推荐模型进行了实验分析,实验表明该方法能够加快算法收敛速度并降低平均绝对误差。(3)本文将相关的方法进行集成与设计,基于BS框架实现了智能推荐工具,并完成了该工具的工程部署与软件测试,各项功能测试和性能测试均满足基本要求。

其他文献

腹腔镜下早期子宫颈癌根治术的临床应用

目的研究腹腔镜下早期子宫颈癌根治术的临床应用效果。方法方便选取2014年1月-2019年10月在该院治疗的60例早期子宫颈癌患者作为研究对象,按手术方式的不同分为对照组(予以经

期刊

腹腔镜早期子宫颈癌根治术子宫颈癌并发症LaparoscopyEarly radical resection of cervical cancerCerv

影视节目错误传播法律信息探究

当前,我国已经进入了普法的第七个五年规划,影视节目的法制宣传,对普及民众法律知识,公正、合法、有效地解决某些社会问题、解决当事人的纠纷发挥了重要作用。但目前影视节目

期刊

影视节目错误传播法律信息

海洋贝类提取物抗肿瘤活性的研究进展

海洋抗肿瘤活性物质一直是海洋药物研究的重点。现已发现海洋生物提取物中至少有10%具抗肿瘤活性,包括核苷酸类、酰胺类、聚醚类、大环内酯类等化合物,其中阿糖胞苷等已形成

期刊

海洋贝类活性物质抗肿瘤活性

浅析我国残疾人旅游市场开发对策研究

随着社会的发展,我国的残疾人旅游市场发展前景广阔,旅游业应该看到这一潜在的旅游市场。本文分析我国残疾人旅游市场开发中所面临的问题,并提出了相应的残疾人旅游市场开发

期刊

残疾人旅游市场对策

高校传媒的思想政治教育功能研究

如今大众传播媒体已经与人们的生活密切相关,校园传媒也在随着现代传媒技术的不断发展而迅速更新。高校校园传媒是校园内部及学校与社会进行交流、传播信息的工具,是广大师生

学位

高校校园传媒思想政治教育功能

供应链弹性管理——应对供应链中断危机

从供应、需求和供需联合三个角度分别提出和研究相应的供应链弹性策略。$$冰岛的艾雅法拉火山喷发时，谁想到这竟会导致宝马在南卡罗来纳州斯帕坦堡的工厂和日产汽车公司日本组

报纸

血液透析医院感染危险因素分析与护理干预措施

目的:分析引发血液透析医院感染的危险因素,探究护理干预措施。方法:收治血液透析患者420例,从危险因素、临床护理特征两个方面进行回顾分析。结果:血液透析患者发生医院感染

期刊

血液透析医院感染危险因素护理干预

基于浏览记录的文本挖掘与智能推荐研究与实现

其他学术论文