基于在线评论的个性化多产品摘要算法的研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:lkajdofaief
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,观点摘要技术为世界各地的消费者带来了极大的便利。从大量的在线商品评论中,观点摘要技术自动为给定商品的大众观点生成摘要。然而,当前的观点摘要系统为每个商品所提供的摘要通常是静态、粗粒度的,这样的摘要在处理高度动态和个性化的用户偏好时具有很大的局限性。因此,在用户评估候选商品的阶段,这种摘要无法为其提供所需要的有效的指导意见。  在本文中,我们通过生成个性化的多商品摘要为消费者提供决策支持。本文的目标是生成简洁的商品动态摘要,它可以体现出用户所喜爱的特征的重要信息,同时能够兼顾不同商品之间的差异性。  首先,为了使得生成的摘要满足以下的三个特征:高度精简性、集中覆盖性、差异性,本文将个性化的多商品摘要问题建模为特征树上的带有可变覆盖半径最小代表特征集问题,树上每个被覆盖的区域都包含了商品各种各样特征的观点,从层次结构上来看,这些特征在语义上是相互关联的。为了获得最优的覆盖半径,我们会为层次结构上的每个特征赋予一个实时推导出来的偏好权重,并结合商品本身的差异性,以此来指导最优半径的选择。  除此之外,本文中使用了有监督的模型实现特征识别,同时在提供部分已标注语义层次关系的前提下自动构造出特征的层次结构。在特征识别和特征的排序学习中,我们都使用到了观点挖掘技术。同时,商品特征的层次结构中使用了满足最大召回率的贪心算法。  最后,从真实的数据集上的实验结果和用户案例分析的结果上来看,本文中提出的方法展示出了有效性和合理性。
其他文献
面对科研活动节奏的日益加快及科研问题的不断复杂化,科研工作者们急需找到一类新的科研协作工具来满足不断被提出的科研协作需求。互联网技术的发展淡化了时空界限,互联网应用
在以高效快节奏为主旋律的当代社会中,医学发展模式有了极大的改观:由单纯的治疗朝着预防保健方向转变。在此革命性的转变中,即时检验(Point ofCare Testing,以下缩写为POCT)在
Linux以开放源码为主要特色,以性能稳定、设计简洁、支持体系结构广泛、应用程序丰富等众多优点,被用于几乎所有的计算机领域。但是,在视频监控、双机热备、集群存储等实时控制
现在Web应用变得越来越流行,基于Ajax技术的新一代Web应用程序如Amazon.com,Gmail等不断出现,它们都包含了大量的客户端代码运行在浏览器中。由于客户端环境和浏览器配置的多
随着数据库系统的应用普及,软件测试在保证数据库应用系统质量和可靠性方面发挥着重要作用。数据库应用系统的测试需要事先在测试数据库中生成一些测试数据,也称为测试数据库
医学图像配准是为了实现一幅医学图像与另一幅医学图像上对应点、面或像素值通过几何变换达到空间上的一致,从而将多种模态的图像信息融合成一幅新的图像,提供给医生更加丰富
随着经济和社会的发展,人们对汽车的安全性、舒适性、燃油经济性等方面提出了更高的要求,来自汽车功能和开发成本、上市周期各方面的压力,汽车电子软件的开发面临着越来越大的挑
实时数据库是实时系统与数据库技术有机结合的新型数据库,它具有时间约束性。在时间关键型的应用中传统数据库技术已不能满足需求,实时数据库技术成为研究热点。随着电网规模
GPS(Global Positioning System)车载导航技术是GPS技术随着嵌入式技术、汽车工业的迅速发展而逐步兴起的,广泛用于交通监控,车辆导航等方面。在我国,市场上各种基于GPS导航的产
学位
在机器学习领域中,当要分类的数据集类别分布差别较大时,就称为不平衡数据分类。它是目前在机器学习和数据挖掘领域里一个研究热点。不平衡分类问题在现实生活中经常出现,而传统