论文部分内容阅读
品牌(Brand)是一家企业综合品质的体现,而品牌经济已成为我国的主要经济形式之一。正确的营销方式对品牌的发展有重要的作用,因此,如何利用数据开展品牌跟踪(Brand Tracking)、指导品牌营销是一个重要的研究热点。品牌跟踪是对指定品牌的广告信息、用户评价等品牌接触点在时间和空间上的跟踪,全面监测和分析品牌接触点数值按时间序列的变化情况和趋势,实现对品牌营销效果的评估,进而为品牌建设提供数据支持,促进品牌经济的发展。品牌营销和品牌跟踪的方法与传播媒体的发展有紧密的联系。随着社交媒体日趋流行,各类品牌逐渐重视在社交媒体中开展营销工作。同时,由于社交媒体所具有的互动性和群体性特点,使品牌营销和品牌跟踪的方式产生了新变化。社交媒体中开展品牌跟踪所面临的首要问题就是如何从海量数据中将品牌信息高效、准确的抽取出来。解决这类问题的常见方法是将品牌作为一类实体对待,采用信息抽取的方法来解决。然而,传统的信息抽取方法应用至多媒体化的海量社交媒体数据面临无法分析多模态数据、效率低下等问题,多媒体信息检索技术为解决这些问题提供了有效途径。本文以社交媒体中的品牌实体信息为研究对象,对品牌实体信息检索在特征提取、构建索引、检索匹配阶段的关键问题展开研究,主要研究内容包括以下五点:基于深度学习的单模态品牌实体信息表示。针对特征提取的过程中,传统的特征提取方法所提取的特征表达能力不足的问题,提出了基于深度学习的品牌实体信息表示方法,提取单一模态的特征。该方法根据局部空间量化的思想,先通过深度学习模型提取具有更强表达能力的局部特征,然后采用全局量化的方式生成品牌实体信息的全局特征。此外,该方法还采用了基于三元度量学习的模型训练机制,以解决训练样本稀缺的问题。实验结果表明,与以往的特征提取方法相比,所提方法生成的品牌实体信息表示具有更好的判别力和鲁棒性。基于关联性推理的多模态品牌实体信息获取。针对构建索引的过程中,传统跨媒体分类模型训练不稳定、欠拟合导致的品牌实体信息识别精度不高,品牌实体信息难以获取的问题,本文提出了一种基于关联性推理的跨媒体分类方法,并应用于社交媒体中的品牌实体信息获取当中。该方法采用多实例多模型的协同学习机制,并结合样本间语义关联、地理位置、用户连接、社交距离等社交因素,对社交媒体数据与品牌实体的关联性进行推理,改善了模型不稳定、欠拟合等问题,进而提高了品牌实体信息获取的性能。实验表明,所提方法比传统的分类方法具有更好的准确性和稳定性。基于质量偏倚模型的品牌实体信息跨媒体检索。针对检索匹配的过程中,传统信息检索方法只注重内容相似性匹配,忽略样本质量好坏所导致的检索结果有效信息缺乏,检索准确率低等问题,本文提出了一种基于质量偏倚模型的跨媒体检索方法,并应用于社交媒体中的品牌实体信息检索当中。该方法提出了一种基于多视角正交映射的同构子空间学习算法,进而实现在同一度量空间内衡量的多媒体内容相似度;还提出了一种质量偏倚模型,将样本质量与内容相似度结合完成检索匹配,提升了检索结果的质量。实验结果表明与以往的检索方法相比,所提方法在品牌实体信息检索任务中能取得更准确的检索结果。基于语义一致哈希的品牌实体信息高效跨媒体检索。考虑到检索匹配对于海量数据处理的时效性要求,在前面方法的基础上,本文提出了一种基于语义一致哈希的品牌实体信息高效检索方法。以往的哈希方法面临两个难题:如何在特征映射时保持数据的语义一致性,以及如何减少二值化过程中的量化损失。针对这两个问题,所提方法从类标一致性和度量一致性两个方面保障了特征映射的语义一致性,同时,还采用了离散优化的方式直接生成哈希码,减少了量化损失。将所提方法用于对大规模品牌实体信息检索当中,优化了检索效率。实验表明,所提方法能够生成高质量的哈希码,并有效提升海量数据环境下的品牌实体信息检索效率。此外,通过各章节所提方法进行整合,形成了一个品牌实体信息检索框架,通过实验验证了该框架的有效性,并对各章节所提方法在整个框架中所起的作用进行了分析。