【摘 要】
:
随着互联网与社会经济的快速发展,人们的生活方式和消费习惯发生了深刻的变化,越来越多的人选择购买汽车,并在相关汽车评论网站如太平洋汽车网上发表自己的购车体验和产品的
论文部分内容阅读
随着互联网与社会经济的快速发展,人们的生活方式和消费习惯发生了深刻的变化,越来越多的人选择购买汽车,并在相关汽车评论网站如太平洋汽车网上发表自己的购车体验和产品的使用感受,这些评论也成为了消费者了解汽车信息、企业把握用户需求的重要依据。如何快速有效地利用这些汽车评论网站上的用户评论,挖掘其中蕴含的情感信息和消费者对产品的需求是当前面临的重要问题。因此,本文以海量汽车在线评论为数据支撑,开展基于证据推理的汽车评论情感三分类研究和汽车综合评价分析,期望辅助消费者做出更准确的决策,帮助企业更加便捷、有效的从汽车评论中提取用户需求。具体工作内容如下:(1)本文通过Python爬虫从太平洋网站上获取汽车各个评论属性的在线评论数据,对数据进行去重、去除乱码字符等初步清洗工作。分词过程中,考虑到汽车领域的专业词汇和网络流行词,构建了改进的分词词典,并综合哈工大、百度和搜狗停用词词库,对无效用的停用词进行剔除,从而提高分词质量。在此基础上,使用卡方检验方法进行特征提取,使用改进的TFIDF方法计算权重,构建文本数据向量化矩阵。(2)本文提出了一种基于证据推理的多分类器汽车评论情感三分类方法,以朴素贝叶斯、逻辑回归和支持向量机为基分类器,利用证据推理规则集成三个基分类器,并考虑了每个基分类器的权重和可靠性,然后对评论文本进行情感三分类。与单个基分类器和流行的集成分类器相比,本文所提方法情感分类效果更佳。(3)在本文构建的情感三分类模型基础上开展了基于证据推理的汽车综合评价分析,以SUV车型为例,对汽车各评论角度的情感分布和整体综合情感分布进行分析,并基于词云方法挖掘汽车的优劣势,同时将此过程应用化,初步构建汽车评论情感挖掘系统的系统框架,方便企业直观了解分析结果。
其他文献
本文通过采用射频磁控溅射法制备Mg掺杂Ga_2O_3薄膜,并研究双靶交替溅射和混合靶材直接溅射两种掺杂方式对薄膜性质的影响;之后选用掺杂方式更好的方式制备不同溅射条件下的Mg掺杂Ga_2O_3薄膜,并将其中一组样品进行后退火处理,并使用X射线衍射仪(XRD)、紫外分光光度计(UV-Vis)、原子力显微镜(AFM)、扫描电子显微镜(SEM)、能量色散谱仪(EDS)以及光致发光谱仪(PL)等测试仪器对
异常行为检测目的主要是从智能监控视频的场景中自动检测分析出不同寻常的运动行为,这对于智能视频监控系统对实际的应用场景中的运动进行监控,并对视频场景中的内容信息进行
负载能力是衡量机械臂性能重要指标,由于关节型机械臂多为电机直接驱动,工作过程中电机随关节一起运动,导致关节输出转矩受制于驱动电机的重量,转矩越大所需要的电机尺寸就越
设备监造对于工程项目的实施至关重要,是促进工程项目顺利实施、安全稳定运行、提升工程项目单位整体经济效益的重要保障。本文以锡林郭勒盟东乌旗褐煤提质项目为例,通过设备
近年来,随着我国现代化进程不断加快,汽车的保有量急剧增加,这同时也导致了交通事故的频发。为保障生命财产安全,各大汽车厂商愈加关注汽车的主被动安全以及辅助驾驶或自动驾
信用评估分类是企业风险管理的重要组成部分,其主要目标是根据客户信息资料从中甄别出优质客户和不良客户,寻找出影响客户信用的关键影响因子,为企业管理层信用决策提供参考
人脸的识别技术历史悠久,目前也逐渐趋于成熟,并已广泛的在各领域上进行应用的推广。由于人脸识别技术的发展,人脸相似度判定和面部图像检测技术也得到许多领域的关注,例如刑
幼年动物长时间或反复接受全身麻醉可引起中枢神经系统神经元的广泛凋亡,尽管有研究提示全麻药的这一神经毒性作用可能与其抑制发育期,特别是突触形成高峰期神经网络的电活动
随着互联网技术的不断进步与发展,网络购物平台的用户数量与日俱增。在众多可供浏览与购买的在线商品中服装占据了较大比例与营收份额。在此背景下,如何高效地检索、推荐在线
人体参数测量在服装定制、人机工程学等诸多其它领域有着较为广泛的应用。传统的人体参数测量方法有测量过程所需时间较长、测量的准确度依赖人的经验水平等不足之处。近年来