【摘 要】
:
微博作为当下非常热门的网络社交平台,其中覆盖的讨论话题非常广泛,从时政新闻、医疗、娱乐到学术方面,参与话题的民众也包含了各个年龄层,网民可以对自己关注的话题进行评论。这也就导致了微博中包含大量的文本信息,通过对微博的评论文本进行情感分析,在产品方方面,产品方可以了解民众对于产品或者策划活动的态度,对此进行改进;在政府方面,政府可以了解民众对网络事件的态度以及发酵情况,从而更好的引导社会舆论。因此,
论文部分内容阅读
微博作为当下非常热门的网络社交平台,其中覆盖的讨论话题非常广泛,从时政新闻、医疗、娱乐到学术方面,参与话题的民众也包含了各个年龄层,网民可以对自己关注的话题进行评论。这也就导致了微博中包含大量的文本信息,通过对微博的评论文本进行情感分析,在产品方方面,产品方可以了解民众对于产品或者策划活动的态度,对此进行改进;在政府方面,政府可以了解民众对网络事件的态度以及发酵情况,从而更好的引导社会舆论。因此,文本情感分析的不仅具有商业价值,也对社会稳定起到一定的积极维护作用,文本情感分析的研究是一个十分有意义的课题。本文主要研究工作如下:第一,提出了表情符号向量化的方法。首先构建了表情符号的数据集,构建了描述性语句的正负向样本,其次,使用词向量工具,通过对表情符号名称以及描述性语句的概率相似性建模,得到表情符号的向量。第二,构建了一个BiLSTM-CNN的串行模型。由于中文文本存在一词多义的情况,引入双向Bi LSTM模型用以提取包含上下文信息的文本特征。中文文本结构比较复杂,CNN模型可以提取重要特征,引入CNN模型来提取文本的局部语义特征。其他研究将两个模型并行起来,首先使用CNN提取局部语义特征,再用Bi LSTM模型提取局部特征的上下文信息,仍会造成信息缺失的情况,本文将两个模型串行,同时提取两方面的特征,使输入模型的特征更加完整。第三,使用数据集对比验证了模型的有效性。在表情符号方面,首先使用基础的CNN方法对其进行验证,后续补充了Bi LSTM-CNN串行模型上的对比验证。在Bi LSTM-CNN串行模型方面,使用了基础的Bi LSTM模型和CNN模型进行了对比验证。
其他文献
近年来,随着互联网领域的蓬勃发展,催生出了一大批线上音乐平台,用户可以通过音乐软件在线听歌,并订购会员服务享受更多的权益,数字音乐消费模式正逐步走向“付费时代”。然而,随着音乐平台如雨后春笋般地竞相涌现,它们之间的竞争也变得愈发激烈,如何留住付费用户、提升平台收益显得至关重要。现如今,用户流失行为在通信、银行、金融等领域的实证研究早已成为学术界研究热点,但是在互联网产品、电商等领域的研究却比较稀少
大数据时代,信息传递与反馈速度加快,这就使得A/B测试越来越受到大家的重视,快速的、灵活的对比实验能迅速的找出问题所在,避免大规模的资源浪费,所以设计一个好的实验是至关重要的。简单来说,A/B测试在产品优化中的应用方法是:在产品正式迭代发版之前或新策略上线前,为同一个目标制定两个(或以上)方案,将用户流量对应分成几组,在保证每组用户特征相同的前提下,让用户分别接受不同的处理,根据几组用户的真实数据
目的研究子宫内膜异位症痛经行以中药(血府逐淤汤加减方)治疗临床疗效。方法将本院接收的80例子宫内膜异位症痛经患者随机分成两组,即对照组、研究组,组内患者分别为40例。对照组行以西药(米非司酮)治疗,研究组给予中药(血府逐淤汤加减方)治疗,对比组间患者临床疗效,观察其治疗前后疼痛评分,同时对比其疾病复发率。结果与对照组77.5%/12.5%相比,研究组总有效率95%更高,复发率0.0%更低,且治疗后
当前,在纷繁复杂的国际经济环境和国内经济深层次矛盾凸显的大背景下,我国正处于从经济大国向经济强国转变的重要时期,而实现这一转变的关键在于经济增长质量得到持续提升,其中要解决的一个问题则是区域经济增长不平衡的问题。长远来看,不平衡的区域经济增长不利于整体经济的持续稳定增长。普惠金融体现的是所有社会成员都能有同等的机会获得金融产品和服务这一理念,这意味着向更多的欠发达地区、弱势群体、小微企业提供他们所
依赖于股票路径、利率、其基本条款等的复合衍生品的可转换债券,是普通债权、嵌入了标的股票期权的结合体。我国资本市场的迅速发展,近年我国的可转债市场也与资本市场发展状况同步,为促进可转债市场健康稳定发展,研究如何对可转债进行更加准确定价非常重要。可转债内嵌债券与转股权,其转股权类似于美式期权,在不触发特殊条款情况下,当期转股价值大于持有价值时进行转股。基于可转债的条款属性,其定价的研究主要是借鉴美式期
进入21世纪以来,受资源枯竭和环境恶化的双重影响,清洁的可再生能源逐步取代化石能源成为不可逆转的趋势。光伏电池片是一种固态半导体器件,能够将太阳能转换成电能,光伏组件是光伏电池片集成后的产物。我国是光伏制造业大国,光伏组件、电池片等多项产品的市场占有率是世界第一。随着市场竞争增大以及国家补贴政策的变化,如何在生产环节进一步降低成本以光伏电价是未来光伏行业竞争的主要挑战。目前,光伏组件生产过程中的质
脑动静脉畸形(Arteriovenous Malformation,简称AVM)是脑血管组织中的畸形团,属于一种先天性局部脑血管发生学上的变异。脑血管的畸形区域将导致颅内出血、癫痫发作等多种疾病。因此脑动静脉畸形的精确分割,可以辅助医生对相关疾病进行医治,缓解医生工作压力,为病人提供更准确的诊断。核磁共振成像(Magnetic Resonance Imaging,简称MRI)作为先进的医学影像采集
在工业化4.0时代,目标检测一直是智能制造的热点话题。不论在物体缺陷检测方向,还是自动驾驶领域,目标检测都逐渐显现出它不可替代的作用。本文分别从像素经验分布和深度学习两个独立的角度出发来研究目标检测问题。从像素经验分布角度出发,本文将用于视频中运动物体分离的Vi Be算法[1]应用到电路板焊点缺陷检测上,并利用DBSCAN密度聚类算法[7]过滤噪音点,使算法能够以最小的成本快速找到问题电路板;从深
随着全球大数据浪潮的席卷,依托于互联网的广告一直在蓬勃发展,速度迅猛,诸如Google、Facebook、字节跳动等公司已将广告事业作为其支撑。本文的研究领域为互联网游戏视频广告,这里的广告主为游戏公司,传播媒介为Google、Facebook、Tik Tok的视频投放渠道,产品为游戏。本文处理了游戏公司2020年7月到10月的视频广告素材内容数据与和视频广告素材效果数据并将两块数据关联,获得了拥
新唯物主义是新近西方涌现的关于物的存在的反思的思潮。其中的代表人物包括思辨实在论的甘丹·梅亚苏、格拉厄姆·哈曼,生命唯物主义的珍妮·本内特、行动实在论的凯伦·巴拉德,以及操演性唯物主义的托马斯·内尔。从马克思的历史唯物主义的物的理解出发,反思这一批新唯物主义的理论价值和历史局限,认为新唯物主义并没有真正摆脱马克思曾经批判过的感性直观形式来思考物的形而上学路径。而真正历史唯物主义的方法,需要在具体的