基于图模型与组合特征的推荐方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:king2xl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代基于网络的商业行为规模巨大,由于产品或者实体的数量繁多,用户不可能一一去阅览,从而有可能遗漏掉很多对用户有价值的商品。推荐系统是信息过滤领域的一个子集,目的是预测用户对于物品的评分或者好感度,从而可以在用户没有接触过的物品中迅速地为用户找出他们可能最感兴趣的物品。随着网络数据量的持续大量增长,半结构化数据的使用率也在日益走高。作为一种贴近真实世界的数据表示方式,图模型可以表示多元及多重关系,并给许多以往的工作与面临的问题提供了一种新的解决方案。图数据模型能够将多种推荐方式统一到一个完整的模型中,并且形成一个具有统一标准的特征空间,并利用基于图的度量标准来推荐候选物品。现有的基于图的工作通常基于路径来建立数据的特征空间,往往只关注到一个物品对于描绘用户的影响。在如上所述的背景下,本文的主要工作是基于图数据模型深入研究提升推荐系统性能的方法。本文提出了组合特征的概念,更关注多种物品的组合对于用户画像构建的贡献。组合特征提出的基本动机是,以用户对应的部分物品的组合而非单个物品作为用户特征的构建基础时,具有更精确的推荐效果。在构建特征模式时,从物品集合以及与它们直接联系的节点构成的图中提取树模式作为特征。计算特征值时,利用物品集合的度中心性调节特征值。本文基于组合特征设计实现了基于用户的协同过滤方法与基于排序学习的方法。基于用户的协同过滤,有别于首先查找相似物品的基于物品的协同过滤,是以首先查找相似的用户为基础,然后再为用户构建推荐列表,更加便于基于组合特征构建特征空间。此外,传统的推荐方法在复杂物品的表示与处理、算法的可扩展性、用户及物品的冷启动、二元关系矩阵的稀疏性等问题上都一定程度地存在着瓶颈。而基于排序学习的算法将物品的相对次序考虑进优化过程之后,更加贴近求推荐列表时需要计算物品排序的基本问题。本文在组合特征的基础上进一步提出了用户-物品画像的构建方法,设计了基于排序学习的推荐方法。最后,根据所设计的两种推荐方法,本文实现了推荐系统原型,着重实现了其中的用户画像构建模块与推荐服务模块,验证了算法的有效性,以及基于组合特征对提高推荐精度的实际效果。
其他文献
现在的商业界处于一个快速连续变化的信息环境中,激烈的竞争使他们希望信息系统能够敏捷灵活的处理市场和组织业务的变更。业务流程总是随着时间发生变化的,经常出现难于预料
随着全球化进程的推进,跨国企业的发展,越来越多的语言进行互相翻译。统计机器翻译具有效率高、成本低的特点,具有广阔的应用前景。但是目前统计机器翻译系统的翻译性能还有
 本文的目标是研究并实现科学数据库元数据注册系统。研究工作分为三个阶段进行:首先,综合分析比较了元数据互操作技术,从科学数据库元数据互操作问题的出现背景引出了国际上
人工智能研究者认为智能Agent必须能够采取某种理性方式维持其心智状态的一致性,进而认识到信念修正理论是Agent各种智能行为的逻辑基础。随着对多Agent系统研究的进展,多Agent
本文涉及一种社区宽带综合业务网络系统,使用交换式以太网技术,在一个物理网络上实现常规电话网、数字电视网、计算机网的基本业务,为社区用户提供IP电话、数字电视、Interne
随着Internet的飞速发展,Web的信息量越来越大,通用搜索引擎在信息采集、存储等方面面临更大的挑战。此外,由于通用搜索引擎面向所有的用户,力争在返回结果上做到面面俱到,而
  LDAP的不断发展完善及其在分布式环境中的广泛应用促进了目录服务的发展,然而在网络中总是有一些不安全的因素存在,对于那些对安全性要求较高的应用而言,提供安全可靠的目录
本文在分析和总结当前主要视频会议技术的基础上,论述了基于IP的集中式视频会议系统的设计与实现。全文共分七章:第一章简要说明视频会议的现状、发展趋势,以及关键技术;第二
Internet的出现使计算机软件所面临的运行环境开始从静态封闭逐步走向动态开放。为了适应这样一种发展趋势,软件系统开始呈现出一种柔性、多目标、连续反应式的新的系统形态,我
  VoIP电话网关是VoIP电话系统的重要组成部分,它提供了IP网络与PSTN网络的接口,将IP技术与传统的电话网络相融合,实现IP数据包与PSTN语音数据包的实时交换。 本文进行了实