社交网络评论中的反语识别研究

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:linjavac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的蓬勃发展,网络中的文档成为主要的信息载体,是人们生活中主要信息来源。随着互联网Web2.0时代的到来,人们从被动接受门户网站的信息,转为主动在社交媒体上发布、共享、传播信息。由于用户参与信息产生过程中,网络信息的内容形式也变得多种多样。这些关于观点性的内容对社会舆情分析、电子商务等方面都有着重要的意义和实用价值。针对这种观点性文本的情感分类逐渐演变为一个热点问题。在网络文本中经常出现反语,他们利用反语来表达主观的以及深层次的观点,反语的使用将大大增加情感分析的难度。为了提高情感分类的准确度,需要探讨反语识别,因此本文研究的是反语识别。本文主要从两个方面研究反语的识别:一是基于规则的反语识别方法;二是基于机器学习反语识别方法。对于基于规则的反语识别方法,本文中提出了两种反语识别的规则——歇后语规则、违反常识规则,这也是本文的创新之处。对违反常识规则部分引入了矛盾关系检测,通过矛盾关系中的反义词规则和否定词规则,来判断文本是否是违反了常识规则。满足上述两种规则中的其中一种的文本则判定为反语,对于不满足规则的文本,使用机器学习方法训练分类器,识别出反语。训练分类器过程中,构建特征体系——英文词、特定的语气词、文本中特定的词汇、网络词汇、谐音字、连续的标点符号,将分词后并删除停用词后的所有不重复词也纳入特征体系。计算只使用机器学习方法进行反语识别的性能,同时也计算规则结合机器学习方法进行反语识别的性能,并比较这两种方法的性能。本文发现本文中提出的规则结合机器学习方法对反语识别相对只使用机器学习方法是更有效的。
其他文献
复杂多变的全球经济环境,全球经济的持续衰退……面对巨大的世界变局,习近平总书记在2020年7月21日召开的企业家座谈会中再次强调,要逐步形成以国内大循环为主体、国内国际双
期刊
转变经济发展方式,推动经济结构战略性调整,既是保持国民经济发展活力的现实要求,也是推进科学发展的必然选择。经济发展方式转变将助推国民经济由粗放型发展向集约型发展转化,进
毋庸赘言,谁都知道2020年有多么的“叛逆”,一场全球肆虐的新型冠状病毒肺炎疫情让整个世界改变了太多.全球经济增长速度明显放缓,制造业受到巨大冲击,家电产业链上的每家企
期刊
对生产企业而言,应对外部环境中的诸多变化是最让人头疼的事,而2020年注定会是变数叠加最多的一年.冰箱压缩机产业可以说是经历过大风大浪,发展史上几次跌宕起伏才有了如今的
期刊
无论2020年形势多么错综复杂,产品过硬才是发展的硬道理,依然是压缩机生产企业参与市场竞争的根本.接受《电器》记者采访的企业纷纷表示,后疫情时代将克服一切困难抓生产,困
期刊
2020年8月,国内无取向电工钢市场价格继续上涨,主流钢厂出台9月期货价格政策上涨200~300元(吨价,下同)不等,钢厂优惠基本没有调整.截至月末,上海市场50WW800牌号资源均价为520
期刊
股票市场的财富效应是指股票所代表的虚拟财富的增长会对居民消费产生一定影响,影响消费及国民经济。本文将股市财富效应分为直接效应和间接效应,直接效应传导机制为股市价格影
耐人寻味的足,在这个逆全球化言论甚嚣尘上、新型冠状病毒肺炎疫情给全球经济合作交往设下重重障碍的2020年,冰箱压缩机产业内部,那根关于全球化战略布局的发条却又上紧了两
期刊
本文详细分析了同步沥青碎石封层施工技术的相关内容,包括概念、原理、应用等,有一定的参考性和借鉴性.