基于机器学习的个性化推荐算法研究

来源 :哈尔滨工程大学 | 被引量 : 10次 | 上传用户:xuanwuba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,网络上数据已呈爆炸式增长。海量的数据一方面使人们更加容易的获取到丰富的信息,另一方面人们却不得不花费大量的精力和时间来搜索对自己有用的信息,信息超载问题越来越严重。面对海量的数据资源,传统的搜索引擎已经无法满足用户的需求,个性化推荐系统成为时代的新宠。个性化推荐系统通过分析用户数据,捕获用户的兴趣,向用户推荐其感兴趣的信息或商品。本文针对现有推荐系统存在的冷启动、数据稀疏性、准确率低等问题,引入目前研究热点——机器学习方法,进行了迁移学习的跨域推荐、多源多任务的兴趣推荐、BP-RNN的混合推荐以及基于本体的旅游推荐研究,为实现个性化推荐设计了相应的算法研究。论文的主要贡献包括:针对单一域数据的稀疏性问题,提出迁移学习的跨域推荐算法模型CTR-TL。该模型依据各个域上的数值评分数据,结合各个域上的评论文本信息,对各域进行单一域内的建模。并依据各个域上的数值评分数据挖掘域间联系即迁移模式,对各域间进行跨域建模。最终,结合单一域内建模和域间的跨域建模,同时对多个域进行联合的建模,实验证明模型CTR-TL可实现良好的跨域推荐效果。针对现有推荐算法准确率低的问题,提出多源多任务的兴趣推荐算法。首先利用用户多个社交网络的个人信息,构建表示兴趣之间关联程度的树状图;然后基于Web的兴趣文本表示,用包含标签词汇及其权重信息的文本来代表兴趣,结合用户多个社交网络的多源多任务进行兴趣推荐研究;最后构建兴趣的共现矩阵,可提高准确率和召回率。针对已有推荐算法鲜有考虑时序问题,提出BP-RNN混合推荐算法。针对在短期推荐系统的用户消费最有可能取决于最近行为的现象,建立一个循环神经网络,使用门控循环单元解决时间序列的问题。循环神经网络将用户近期行为视为一个序列,每个隐藏层按顺序模拟每一位用户的行为或喜好。将循环神经网络与反向传播神经网络相结合,可获得更好的预测精度。针对推荐算法在多标准下少有优越表现的问题,提出基于本体的旅游推荐算法。首先构建适合旅游领域的旅游景点本体,接着采用FP-Growth算法挖掘访问不同景点的用户之间的关联规则,然后将协同过滤算法根据用户的不同分别改进成TEUCF算法和TAUCF算法。针对关联用户采用融入时间因子及具有特色的评价因子的协同过滤算法,将推荐结果进行上下文信息的过滤,从而更准确全面且符合实际情景。本文提出的算法在不同方面均有较好的表现,实现了推荐算法的个性化,推进了机器学习在推荐系统领域的实用性。
其他文献
在协调推进"四个全面"战略布局的新形势下,统一战线工作必须自觉转变和不断创新理念。统一战线不是要使你变成我,而是要引你与我同行。党发展和壮大统一战线,就是发挥好"我"的领
党的十八大以来,习近平同志多次就法治建设发表重要论述,阐述了全面推进依法治国。加快建设社会主义法治国家的目标和路径,指出依法治国首先是依宪治国,强调宪法的生命在于实施。
六间房油田属于低孔低渗常规原油储层,目前该油田沙三段开发存在的问题体现为无法进行注水作业,经分析发现在注水开发过程中由于注入水水质指标不合理对储层造成堵塞,导致渗
<正> 鉴于商业银行在国民经济中的特殊地位,世界各国都采取了严格管制的政策。本文通过介绍一些国家和地区对商业银行的管理方法,以期对我国商业银行体系的建立提供一些参考
为评估半刚接钢框架内填暗竖缝RC墙结构(简称PSRCW)的超强性能,考虑实际地震动的随机特性,分别选择了22条远场和22条近场地震动记录,基于增量动力时程分析方法(简称IDA)获得了10层PS
城市的快速发展造成目前城市中心区高度密集,而高密度城市中心区的微气候影响着其空间生活品质。本文通过对高密度城市中心区空间形态的相关研究综述,明确了城市空间设计与城
芯棒是限动芯棒连轧管机组的主要变形工具之一,限动速度的合理设定有助于减小芯棒磨损,提高产品质量,降低生产成本.采用MPM连轧数模及德国Meer公司的二级控制方法,可推算出与
随着当代旅游业高速发展,对旅游信息的检索需求不断上升。文章主要研究机器学习在旅游咨询系统中的应用。基于人工智能专家系统的思想,首先从知识库,推理机等视角出发论述了
【目的】研究枯草芽孢杆菌核黄素合成途径、木糖代谢相关基因修饰对核黄素合成的影响。【方法】单独过表达或共同过表达核黄素操纵子中的基因、过表达木糖代谢相关基因构建相
基于中小企业技术创新效率现状,运用柯布道格拉斯生产函数分析中小企业研发人员投入及不同来源研发经费投入对技术创新效率的影响,之后利用面板数据变系数模型分析企业自身研