【摘 要】
:
随着移动互联网的高速发展,电子商务和在线社交网络等Web2.0应用快速普及,随之产生了海量且动态变化的用户行为数据。用户评分数据是一种重要的用户行为数据,反映了用户对相关产品或服务的喜好程度。通过分析这些用户评分数据并建立用户偏好模型,能够为精准广告推荐、用户画像等个性化服务提供重要的数据和技术基础,且具有重要意义。近年来,许多研究人员提出了利用隐变量模型构建用户偏好模型的方法,以描述评分数据中的
论文部分内容阅读
随着移动互联网的高速发展,电子商务和在线社交网络等Web2.0应用快速普及,随之产生了海量且动态变化的用户行为数据。用户评分数据是一种重要的用户行为数据,反映了用户对相关产品或服务的喜好程度。通过分析这些用户评分数据并建立用户偏好模型,能够为精准广告推荐、用户画像等个性化服务提供重要的数据和技术基础,且具有重要意义。近年来,许多研究人员提出了利用隐变量模型构建用户偏好模型的方法,以描述评分数据中的隐含知识,从而简化模型和增强模型的可解释性。含隐变量贝叶斯网(Bayesian network with a latent variable,BNLV)作为隐变量模型的一种,能够通过隐变量描述隐含在评分数据中的用户偏好,并且可以描述评分数据中属性间任意形式依赖关系及不确定性。传统的隐变量模型构建方法通常基于批量训练模式的机器学习算法,其假设所有评分数据在整个训练过程中可用。然而,数据通常按顺序到达,用户偏好可能会动态变化,用户产生的评分数据数量也会随着时间的推移而逐渐减少。评分数据稀疏和实时的特性,使得基于批量训练模式的偏好建模算法难以适应现实世界的在线应用。综上所述,本文的主要研究内容概括如下:(1)分析了评分数据中隐含的用户偏好及其相关属性,定义了基于BNLV的用户偏好模型(User preference model,UPM)。(2)针对传统BNLV参数学习算法需要利用期望最大化(Expectation Maximization,EM)算法迭代计算大量数据的问题,通过使用贝叶斯估计扩展Voting EM算法,提出了一种UPM参数的在线学习算法。(3)针对经典结构期望最大化(Structural Expectation Maximization,SEM)算法学习BNLV结构时需要调用EM算法进行参数学习的问题,提出了一种在搜索候选模型结构时重构模型参数表的方法,并改进打分搜索算法,使UPM结构学习能够满足在线学习的需求。(4)基于两个真实数据集测试了 UPM参数和结构在线学习的效率和有效性,并分析了相关实验结果。
其他文献
依法治国是我国治国安邦的基本方略,要想尽快在我国庞大的人口体系下有效地推行依法治国方略,最有效的方法必然是通过教育手段。2014年,十八届四中全会在北京召开,该会议通过了《关于全面推进依法治国若干重大问题的决定》,决定中提到,“要想推动全社会树立法治意识,就要把法治教育纳入国民教育体系中,要从青少年抓起,要在基础教育中设立法治教育课程。”在基础教育课程改革的指导下,起到德育作用的思想品德课顺理成章
纳米网络(Nanonetworks)是指由大量的、尺寸在纳米级或微米级的通信设备相互连接而组成的网络。由于单个纳米组件的尺寸只有约几立方纳米,因而其拥有了纳米尺度上的新特性,在生物医学、环境检测、国防军事以及工业和消费品等领域均有着十分广泛的应用前景。近年来,随着碳纳米管、石墨烯等新型纳米材料的出现,为高工作频率的电磁波通信提供了新的解决方案,使得纳米天线可以有效地辐射太赫兹(Terahertz,
随着众多新兴应用的出现,例如超高清视频、智能家居、云计算、虚拟现实等,网络流量呈现爆炸式增长。2013年8月,中国正式提出了“宽带中国”战略,将宽带网络作为国家战略性公
随着市场经济的日趋成熟,中小企业已经成为了促进国民经济水平实现增长的重要主体,在整个社会经济发展的过程中发挥了至关重要的作用,为社会提供了大量就业岗位的同时,注入了
随着计算机技术和移动互联网的发展,智能移动终端已成为大众上网的主要设备,极大地改善了人们的生活。在智能移动终端上,各种基于位置服务的应用应运而生并日渐丰富,着实为用户带来了诸多便利。顾名思义,基于位置服务的应用需要获取用户位置信息来进行服务,而位置信息常可以与其他信息如时间或用户身份等相关联,应用可以进而推知用户的隐私信息。如根据用户夜间常在地可以推测用户住址、根据用户日间所处位置可以推测用户工作
低轨卫星系统近年来受到国内外广泛关注,各国都在努力部署低轨卫星星座系统,低轨卫星通信系统中功率受限,因此需要一种纠错能力较强的信道编码方案。卫星选择信道编码方案时应将卫星实际情况与编码复杂度等因素结合起来进行综合考虑,从而确定适宜的编码方法和对应的解码方法。由于低解码复杂度和并行解码,同时为了顺应5G与卫星融合的趋势,卫星应更多使用地面5G现有基站资源,LDPC(Low Density Parit
磁场是地球的基本属性之一。在地震预测领域地磁异常作为可能成为孕震的标志,国家地磁台网通过建设台站将专业设备采集到的高精度地磁场要素数据公布,以促进相关领域的研究。而通过台站作为地磁源数据获取手段有其局限性:一、对于短周期的地磁异常,台网的数据订阅式共享对于用户缺乏有效的机制为获取异常时间点附近的细节数据提供支持。二、目前地磁台站最短采集间隔为1/32秒,大多数台站为1秒,对于毫秒级甚至更低的采集间
近年来随着聚类算法应用领域的扩大,可处理的数据类型日趋丰富,基于图论的聚类方法引起越来越多的关注,新的和改进的算法不断被提出。但是,新的应用需求层出不穷、不断变化,且现有的方法也存在不足,因此要对现有方法进行改进,提出新的理论和方法以满足新应用的需求。本文通过对基于最小生成树(Minimum Spanning Tree,MST)的聚类算法的研究分析,发现该算法在执行的过程中利用贪心算法生成MST,
随着国家加大对公共安全问题的重视,公共场所的视频安全监控发挥着极其重要的作用。安全部门可通过监控系统对行人进行特征及身份识别。传统的生物特征识别方法包括人脸识别、虹膜识别等,但是由于摄像头与行人距离较远,拍摄图像不清晰、人脸模糊等问题,传统的身份识别方法已经无法满足当下的需求,而步态识别因其具有远距离可识别、分辨率要求低等优点,成为计算机视觉领域的研究热点。因此,本文对基于步态特征的目标人体检测及
随着移动通信技术进入5G时代和物联网技术的迅速发展,万物互联的“智慧城市”将不再是遥不可及的概念。在新一代移动通信技术的支持下,将会有海量的机器类通信(Machine Type Communication,MTC)设备接入网络,用于智能测绘、可穿戴设备、自动驾驶以及智慧医疗等领域,这种应用场景称为大规模机器类型通信(Massive Machine Type Communication,m MTC)