面向餐饮系统的用户评论文本分类算法的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:niko_robin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,人们可以通过各种在线平台随时随地与其他互联网用户分享自己的真实体验并且进行评论互动。然而当评论文本数量过多时,浏览这些简单堆积的评论需要耗费大量时间,因此将评论文本进行准确的归类划分对高效获取有价值的信息有着十分重要的意义。传统的文本分类需要耗费大量时间和人力去处理海量数据,随着人工智能的发展,利用深度学习和神经网络处理海量数据、提取关键信息的方法应运而生。本文主要对多标签文本分类过程中的文本表示和文本分类方法进行了研究,通过对多组实验结果进行对比分析,取得了如下研究成果:(1)提出在文本表示模型BERT-wwm中采用相对位置编码的方法中文版BERT-wwm模型在学习绝对位置信息时,需要投入大量额外的时间,而结合生活经验发现绝对位置信息在帮助理解文本中相同单词在不同位置的含义时作用是有限的,人们在理解文本信息时更依赖相对的位置信息。针对这一问题,本文在文本表示模型的嵌入层中使用相对位置编码和序列间相互作用关系的方法,进一步提升了中文版BERT-wwm模型的性能。(2)提出在文本表示模型BERT-wwm中为情感特征词分配更高权重的方法本文在对评论文本等篇幅较短的数据集进行实验时,发现模型不能很好的提取到上下文信息中包含的情感特征,甚至出现预测错误的情况。因此本文在文本表示模型的预训练任务中,对文本的情感特征词分配更高的权重,使模型能够更好的利用文本中有效的情感特征信息,从而提高了文本表示模型预训练任务对目标文本的预测准确率。(3)提出基于改进CNN-LSTM模型的多标签文本分类算法本文首先深入研究基于深度学习的文本分类算法,并详细分析了目前常应用于文本分类场景的卷积神经网络和长短时记忆网络算法,及分别利用以上两种模型各自的优势进行集成的CNN-LSTM文本分类模型;随后针对CNN-LSTM模型在多标签文本分类任务中的不足,本文在CNN-LSTM模型上添加了使用标签共现频率初始化的完全连接层作为最终输出层;最终本文提出的文本分类算法在多标签文本分类任务中获得了较高的准确率。本文通过实验对改进方案进行验证,将改进的文本表示模型和多标签文本分类算法分别用于公开的数据集,并设计多组实验进行分析。结果证明本文提出的改进方案能够有效提升中文版BERT-wwm文本表示模型的性能和文本分类结果的准确率。最后将本文改进方案应用于餐饮项目中评论文本的自动分类,为就餐用户和系统管理人员带来了便利。
其他文献
当前信息社会的飞速发展对通信传输的容量和质量提出了更高的要求,如何保证通信系统能够更好地服务于未来数以十亿计的用户和设备正成为一个重要的议题。为了解决频谱资源日益紧缺,与通信系统性能要求不断提升之间的矛盾,人们将目光投向了频谱资源丰富并且尚未被大规模使用的毫米波波段。毫米波具有频带宽、波束窄等特点,同时其超短波长特性使天线阵列的大规模集成成为了可能,因此,毫米波技术与大规模MIMO(Multipl
创业意向(Entrepreneurial Intention)是创业初始阶段的必须要素,也是预测创业活动的重要方面。随着近期我国转型化进程渐渐加快以及社会就业压力的不断加剧,创业逐渐成为大
在过渡金属催化的反应中,膦是最为常见的一类配体,它对稳定活性金属中心原子和微调反应选择性方面都起着至关重要的作用。近些年的研究发现在过渡金属催化的反应中,膦配体的C-P键可以发生断裂,并形成一些意外的偶联产物。这个实验现象促使一些化学工作者产生了研究兴趣,并对C-P的活化和断裂进行了探索和研究。本论文的研究工作就是基于这些研究工作的基础上,通过季鏻盐中C-P键的断裂,结合不同的亲核试剂,实现了一系
针对提升ZnO材料在加速度传感器中的应用,本文基于MEMS技术设计了一种ZnO纳米结构加速度传感器,其结构由硅基悬臂梁、Ti/Pt底电极、ZnO籽晶层、ZnO纳米结构和Ag顶电极组成。基于压电效应的理论基础,利用信号发生器施加一定大小的激振电压对加速度传感器梁体进行激振,ZnO纳米结构和ZnO籽晶层组成的压电层会因梁体振动产生交流电信号,经上下电极导出以实现对输出电学信号的测量。通过COMSOL软
原核生物类泛素化修饰(Pupylation)是在原核生物中发现的与真核生物中泛素化修饰作用相似的一种蛋白质翻译后修饰形式。在该过程中,原核类泛素化蛋白PUP在酶的作用下识别出细胞中的底物蛋白质并对其特定的赖氨酸残基进行修饰。最新研究表明,原核生物类泛素化修饰与某些致病性细菌的致病性密切相关,弄清其作用机制可以为这些细菌所致疾病的治疗提供帮助。在原核生物类泛素化研究中,关键的步骤是找出PUP的底物蛋
资源枯竭型城市是我国城市体系中的重要组成部分,是我国经济建设的中坚力量。自20世纪80年代以来,随着城市的不断发展,资源储蓄量不断减少,社会矛盾日渐突出,城市经济开始衰退,使得人民生活水平不断下降。因此,资源枯竭型城市大都面临着转型的问题,而发展高新技术产业已经成为解决资源枯竭型城市问题的主要途径。高新技术产业是区域经济竞争力的体现,是区域社会发展的新的增长点,资源枯竭型城市能否增强竞争优势,快速
近年来,基于神经网络的深度学习技术取得的进步使得在许多视觉任务上,计算机的表现已经超过了人类,计算机视觉也因此逐渐成为了热门研究方向。而作为一种基础任务的目标检测,也自然而然受到了极大的关注。在一幅图像中,存在着不同尺度的目标,大尺度的目标细节清晰,占据的像素多,小尺度的目标细节模糊,占据的像素少。现有的目标检测方法在图像中同时出现多种尺度的目标时,难以做出适当的处理。相比于只存在单一尺度目标的图
十九大报告指出:“要建立覆盖城乡居民的养老保险体系,提高民生福祉”。一项政策的顺利实施需要政府进行引导,城乡居民基本养老保险作为城乡居民老年生活的重要保障,其建立与发展离不开财政的支持。2014年6月,为响应国家在保障民生工作方面的部署,山西省根据实际情况在全省范围内建立统一的城乡居民基本养老保险制度。山西省各地区经济发展状况以及参保情况存在差异,山西省财政能否承担基础养老金和个人账户养老金补贴标
农业农村农民问题是关系国计民生的根本性问题。中国共产党第十九次全国代表大会上提到民主法治建设已经迈出重大步伐,提到始终把“三农”问题作为全党工作重中之重,要健全自治、法治、德治相结合的治理体系。犯罪行为像顽疾一样侵蚀、危害社会的发展。通过对农民工犯罪问题的研究,剖析犯罪行为,分析经济因素对犯罪的影响,为降低犯罪行为提供理论依据,保障人民的人身与财产安全,从而推动社会经济的进步,为2020年全面建成
介绍某火力发电厂工程(660MW机组、8度、Ⅲ类场地)主厂房采用钢结构支撑框架结构体系设计全过程,包括结构布置;模型的建立与计算;构件的选择;节点设计;此外还包括构造要求等,