论文部分内容阅读
近年来,观点摘要技术为世界各地的消费者带来了极大的便利。从大量的在线商品评论中,观点摘要技术自动为给定商品的大众观点生成摘要。然而,当前的观点摘要系统为每个商品所提供的摘要通常是静态、粗粒度的,这样的摘要在处理高度动态和个性化的用户偏好时具有很大的局限性。因此,在用户评估候选商品的阶段,这种摘要无法为其提供所需要的有效的指导意见。 在本文中,我们通过生成个性化的多商品摘要为消费者提供决策支持。本文的目标是生成简洁的商品动态摘要,它可以体现出用户所喜爱的特征的重要信息,同时能够兼顾不同商品之间的差异性。 首先,为了使得生成的摘要满足以下的三个特征:高度精简性、集中覆盖性、差异性,本文将个性化的多商品摘要问题建模为特征树上的带有可变覆盖半径最小代表特征集问题,树上每个被覆盖的区域都包含了商品各种各样特征的观点,从层次结构上来看,这些特征在语义上是相互关联的。为了获得最优的覆盖半径,我们会为层次结构上的每个特征赋予一个实时推导出来的偏好权重,并结合商品本身的差异性,以此来指导最优半径的选择。 除此之外,本文中使用了有监督的模型实现特征识别,同时在提供部分已标注语义层次关系的前提下自动构造出特征的层次结构。在特征识别和特征的排序学习中,我们都使用到了观点挖掘技术。同时,商品特征的层次结构中使用了满足最大召回率的贪心算法。 最后,从真实的数据集上的实验结果和用户案例分析的结果上来看,本文中提出的方法展示出了有效性和合理性。