用户冷启动环境下的垃圾评论检测方法研究

来源 :武汉大学 | 被引量 : 1次 | 上传用户:jianghui123789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,电子商务所带来的便利渗透了人们生活的方方面面。其中,在线评论记录来自于消费者的真实体验和感受,因此成为了众多消费者做出消费决定的重要参考依据。这背后存在的巨大商业利益,导致垃圾评论在众多电子商务网站大量涌现。毋庸置疑,垃圾评论的泛滥将严重误导消费者的选择,导致消极的消费体验,同时也将对商家、网站的信誉和发展造成不利影响。因此,垃圾评论检测成为亟待解决的问题。现有工作主要致力于提取有效的语言特征和行为特征用于区分垃圾评论和真实评论。然而,此类特征工程方法在用户冷启动环境下的垃圾评论检测任务中表现耗时且无效。针对用户冷启动的垃圾评论检测研究甚少,最新的研究进展提出基于神经网络联合编码文本信息和行为信息的框架以应对用户冷启动导致的数据稀疏问题。但是,该框架忽略了丰富的属性信息,检测效果有待改进。本文首先提出行为特征生成模型(BFGN),基于评论的文本特征为用户冷启动环境下的垃圾评论生成对应的行为特征。通过深入分析现有方法与BFGN模型的本质思想与存在问题,本文提出了联合建模实体、属性及其间关联的属性增强评论表示模型(AE)。该模型不仅编码评论者、商品、评论等实体信息,同时建模实体的固有属性信息,如地点、时间、价格档等。通过在AE模型的基础上引入领域分类器实现辅助领域与目标领域间的知识迁移,本文进一步提出基于属性增强和领域适应的评论表示模型(AEDA)。通过集成丰富的实体、属性与辅助领域的信息,本文所提出的AE与AEDA模型能够有效应对用户冷启动环境下的数据稀疏问题。在Yelp数据集上的实验结果表明,我们的模型效果均显著优于基线方法。
其他文献
空调已日益成为我国大众居家生活的“必需品”,中国拥有全球80%的空调产能,空调的质量和性能直接影响消费者的体验感受,影响品牌声誉。成品检测手段是保证空调质量的关键,越
燃料电池作为一种零污染、高效率的发电装置被逐渐走入人们的生活。燃料电池阴极氧气还原反应(Oxygen Reduction Reaction,ORR)过程缓慢且复杂,需要消耗大量的铂催化剂。铂催
随着集成电路产业的高速发展,晶体管的特征尺寸不断缩小。如今晶体管尺寸已经进入了深亚微米时代,进一步缩小硅基CMOS器件也面临着更多挑战。而为了进一步缩小集成电路的体积并增强性能,微电子产业将目光投向了集成度更高,性能更好的纳米器件。在众多纳米器件当中,量子元胞自动机(Quantum-Dot Cellular Automata,QCA)作为最有希望替代传统CMOS的技术之一。以往的研究者大多仅使用三
伴随着我国进入城市化发展的新阶段,地方融资平台在解决资金缺口、推动市政建设的同时也导致地方政府债务迅速扩张,严重影响着经济的可持续发展。监管端频繁出台相关政策旨在
当下旅游度假村景观面临趋同性问题,竹作为景观材料所具有的可塑性、可识别性、地域性以及文化特征,是打造旅游度假村景观的可选材料之一。本文旨在从旅游度假村景观竹材的应
近年来,我国水体富营养化程度加深,致使“蓝藻水华”事件频繁出现,对人类的生产和生活造成严重的影响。为有效治理“蓝藻水华”,迫切需要寻找一种高效、高选择性且环境友好的
传统缓速装置依靠单向能量转换帮助车辆减速制动,存在一定的能量浪费,且不能长时间使用。利用混合动力技术的双向能量转换技术实现车辆的辅助制动以及能量回收,减少主制动系
深部地下岩体工程开挖卸荷,围岩体处于梯度地应力环境中。为了研究爆破应力波在具有梯度地应力围岩体中的传播衰减特性,基于自主研发的具有梯度应力岩石应力波传播试验系统,
染料敏化太阳能电池(DSSCs)作为一种安全可靠的未来能源,他因为其高效且易于实现的供应技术而受到了广泛的关注。与传统的硅太阳能电池相比,DSSCs制造成本低、无污染和有竞争力
在研究开发无卤、低毒、高效阻燃剂的趋势下,多元素协同阻燃已引起研究者们的广泛关注。众所周知,含磷、硅的阻燃剂是公认的绿色阻燃剂,而路易斯酸金属在热氧活化下可以催化