【摘 要】
:
随着网络数据的飞速增长,网络信息的真实性与可靠性变得越来越重要,但不断涌现出大量恶意诱导用户的虚假评论使其同时充满了挑战性。因此,自动识别虚假评论给用户带来更为真实可信的资讯至关重要。针对虚假评论识别,现有的大部分基于神经网络的方法虽解决了评论文本上下文语义信息的问题,但能够学习文本深层语义信息的深度学习模型应用较少,未考虑用户、评论与产品三者之间的隐含表达模式。在对数据进行分析之后发现:用户在发
论文部分内容阅读
随着网络数据的飞速增长,网络信息的真实性与可靠性变得越来越重要,但不断涌现出大量恶意诱导用户的虚假评论使其同时充满了挑战性。因此,自动识别虚假评论给用户带来更为真实可信的资讯至关重要。针对虚假评论识别,现有的大部分基于神经网络的方法虽解决了评论文本上下文语义信息的问题,但能够学习文本深层语义信息的深度学习模型应用较少,未考虑用户、评论与产品三者之间的隐含表达模式。在对数据进行分析之后发现:用户在发表真实评论时候会通过对产品细节属性发表感受的方式增强情感表达,即细粒度情感分析任务中的细粒度方面情感,而现有的研究方法没有有效利用相关信息。此外,虚假评论识别任务中还存在着严重的数据不平衡问题。为了解决以上提到的四点问题,本文的主要研究内容如下:(1)本文针对虚假评论识别的策略,提出一个以细粒度方面词为方案,基于注意力机制与BERT模型的多级交互神经网络模型。将用户、评论文本、产品及细粒度方面4个维度的信息融合为评论的表示,从而挖掘用户、评论及产品三者间多层次的隐含表达模式。通过实验验证其有效提升了虚假评论识别的精准率、召回率及模型分类性能,同时也验证了BERT模型在虚假评论识别任务中优秀的建模能力。(2)为了进一步解决虚假评论中所存在的数据不平衡问题,采用数据本身具有的用户行为特征与文本特征进行类别可分性计算,对虚假评论类与真实评论类自动生成代价敏感参数,从而避免了现有研究方法中数据欠采样或过采样造成的信息丢失或噪声信息的产生。为了增强模型在计算过程中的稳健性,对用户、评论、产品三者之间的关系进行建模,并将其用作正则化项对模型的目标函数重定义,将数据之间的关系融入模型建模过程。通过实验验证了本文所提方法对虚假评论(少数类)分类性能的有效提升及可迁移性。(3)本文针对虚假评论识别的策略,从多维度对细粒度方面词及方面情感进一步挖掘利用,提出另一种结合群体智慧和用户个性化情感信息的多维表示的虚假评论检测方法。通过基于产品维度、用户维度对评论进行细粒度情感分析分别有效获取了群体智慧、用户个性化情感,并基于BERT模型对文本上下文信息嵌入的建模能力获取了评论语义信息,将三者基于Triple Network结构进行结合进行文本相似度的计算从而识别虚假评论,为该任务提供了一种新颖且有效的研究方法,从多维度验证了细粒度情感信息对虚假评论识别的有效影响作用。
其他文献
作为国民经济的重要支柱性产业,建筑业的发展却一直受到频发的安全事故的困扰。已有研究与实践表明,工人的不安全行为是引发事故的重要原因之一。安全领导力对于工人的安全行为具有非常重要的影响作用,但目前对于建筑企业基层管理者安全领导力的研究较为匮乏。由于基层管理者身处施工一线,其能够与工人直接、频繁地接触,基层管理者安全领导力对于工人安全行为的影响较为直接且效果显著,但目前对于其影响机理缺乏清晰而系统的认
准确及时的虫情检测是农林业虫情监控的关键技术。传统虫害检测主要依靠人工方式对害虫识别和计数,这种方式费力耗时且易出错,难以满足实际应用需求。近年来,国内外研究者在害虫检测方法上进行了大量研究,其中,基于深度学习的图像处理方法在模型精度和泛化能力上都大幅超越了传统机器视觉方法,在害虫图像检测问题中表现出较强的鲁棒性,但依然存在以下问题:对于复杂自然背景环境下形态各异、密集堆叠且自身颜色与背景相似的害
随着线上购物的飞速发展,不少制造商在线下直销的渠道之外构建了线上直销渠道与第三方线上零售商展开竞争,同时第三方线上零售商通过大量发放优惠券吸引消费者,从而在竞争中取得一定优势。然而,第三方线上零售商通过规则复杂的促销活动来发放线上优惠券给消费者带来了额外的消费成本,使整个供应链的效用受到了影响。因此,研究考虑线上优惠券促销活动下的混合渠道供应链,探讨制造商与第三方线上零售商的定价与营销决策之间的相
由于世界各国环境恶化与资源匮乏问题日益突出,许多国家和地区开始反思问题根源,并出台相关政策确保生态环保落实到位,从而有效减少资源浪费、保护环境。为响应政策要求,相关制造型企业通过投资产品绿色技术、设备等以提高企业产品绿色水平,使自身利润提升的同时,又能提供消费者高绿色水平产品。但在此过程中,又加大了制造企业及其零售商的风险,如研发风险、市场需求风险等。除此之外,随着互联网购物的快速发展,消费模式也
随着“低碳经济”理念的深入,消费者的环保观念逐步增强,并产生参考低碳水平效应进而影响企业的减排行为。在供应链体系中,由于环境的复杂性和对碳减排认知的偏差,供应链成员的互惠利他偏好也会影响企业的减排行为。在二者的影响下,企业在采取各种方式进行减排的同时,往往会利用自身优势将难以完成的碳排放转移给供应链上下游企业,以实现自身利益最大化。实践中,供应链企业间碳排放转移的产生不仅使得企业减排责任难以准确界
DNA甲基化是指DNA序列的特定碱基在DNA甲基转移酶的催化作用下通过共价键结合一个甲基基团的化学修饰过程。DNA N4-甲基胞嘧啶(4mC)和DNA N6-甲基腺嘌呤(6mA)是DNA甲基化的两种表现形式,它们会影响哺乳动物的生长发育,但具体机制尚不明确。因此,准确地检测它们在基因组的位置对深入了解其形成机制和功能作用至关重要。传统湿实验和高通量测序技术成本高、耗费时间长,难以应对爆炸性增长的基
当今时代,生物信息学研究受到越来越多的关注,在生物信息学多个研究领域中,林木基因组是非常重要的研究方向之一。林木基因组在新一代高通量测序技术基础上,测序产生了海量的基因组数据信息。面对越来越多的基因数据,如何有效地从基因序列中收集信息,从而解决生物学问题是当前热门的研究方向。本文在林木基因组已有的研究基础上,从基因组数据库中获取到多种林木基因组数据,完成基因序列处理,序列数据的序列比对和多序列比对
治疗肽是一种由20种氨基酸组成,总长度一般在5~50之间的氨基酸复合物,根据其相关功能可以用作生长因子、激素、神经递质和抗感染剂等,在生物学中起着至关重要的作用。过去几十年中已鉴定出7000多种多肽,具有抗癌、抗菌、抗炎、抗病毒等多种治疗特性。由于这些治疗特性,多肽在提供新的治疗方法方面展现出了巨大的潜力。例如,抗炎肽被用于治疗各种炎症性疾病,如阿尔茨海默病;抗癌肽被用于癌症治疗;细胞穿透肽被用做
中国已经进入人口老龄化社会。面对我国快速增长的人口老龄化问题和养老服务需求,各地区政府、企业家纷纷涉足于养老服务行业,结合当地实际情况,进一步制定了具体的政策方案支持养老产业的发展。为了全面放开养老服务市场,大幅提升养老服务和产品的有效供给能力,使供给结构更加合理,我国《关于全面放开养老服务市场提升养老服务质量的若干意见》指出以供应链模式引领养老服务行业发展。养老服务产业的发展不仅顺应我国老龄化、
随着重识别技术的发展和野外阿穆尔虎数量不断减少,保护这种野生动物对于维持物种多样性至关重要。在面临野外栖息地丧失、偷猎盗猎问题的不断激增,通过重识别方法对单只阿穆尔虎进行保护和追踪变得更加有意义,这项任务越来越依赖于能够精准检测该群体的地理位置和身份信息。本文为解决在阿穆尔虎重识别中遇到的问题,对野外阿穆尔虎重识别中所用到的方法进行了细致的调研、实验、分析,设计了基于正则化和领域适应的阿穆尔虎身份