论文部分内容阅读
摘 要:随着互联网的发展,网络热词是近年来新出现的一种网络传播现象。对网络热词舆情信息的语言学分析是十分必要的。本文从网络热词的传播内容及表现特征、网络热词的采集整理和特点分析、网络热词舆情信息的词语、句式和符号的倾向分析三个方面进行分析,最终达到让正负倾向的情感表达式具有更强的适用性的目的。
关键词:网络热词;舆情信息;情感倾向
1 前言
随着互联网的发展,网络热词是近年来新出现的一种网络传播现象。网络热词的意义不仅是技术上的变化,也带来一系列新闻传播以及舆论监督方式的变化。從上世纪九十年代开始,文本情感倾向性研究逐步受到人们的关注并迅速发展起来,它涉及计算语言学中的多个领域,对于它的基本思路和关键技术,不同的学者有不同的观点。目前对于情感倾向分析的研究主要集中于文本情感分类的思路、技术、语料库和系统评测上,语言学上利用情感分析技术对网络评论文本进行分析的也多见于产品评论,如汽车、影视、音乐、手机等数码产品。网络热词舆情信息的态度倾向分析基本不存在,而对这一新兴语言现象进行情感分析的深入探讨能在一定程度上引导人们正确的使用网络流行体,也能为以后的语言学其他方面的研究提供情感态度分析的参考和整理,为其他学者进一步研究网络流行体提供依据,因而对网络热词舆情信息的语言学分析是十分必要的。
2 网络热词的传播内容及表现特征
笔者对来自百度百科、人民网、互联网热词、新浪网等机构或网站的年度评选,选择了300个网络热词。接着,从来源、领域、是否反映民意、是否反映热点、内容情感倾向等方面进行分析。来源上,主要来自“社会现象”、“新闻事件”、“媒体娱乐产品”、“网络用语”、“故意误用”、“谐音”六个方面。分布领域上,主要分布在“时政领域”、“社会领域”、“生活领域”、“文化领域”、“经济领域”、“其他”六个方面。是否反映民意上,近65%的网络热词是民意的表达,网民创造网络热词,来表达对负面新闻和非正常社会现象进行监督和发表意见,是网民表达民意的手段。是否反映热点上,这些网络热词基本包含了40个当今社会的负面热点问题,如“权利腐败”、“食品安全问题”、“教育弊端”物价疯涨、“社会不公”、“暗箱操作”等民众强烈不满的热点问题,也是当今社会难以解决的热点问题。情感倾向上,对这些网络热词的情感倾向来看,贬义词占70%,中性词占25%,正面的很少。这也基本符合新闻媒体舆论监督的功能。
网络热词的总体特征为:一是,体现了批判为主的立场。网络热词敢于以批判的姿态对社会现实问题进行正视,利用网络平台进行监督、批判,以表达民意和体现王敏的参与意识。二是,民意表达色彩浓烈。三是,网络热词与热点问题联系紧密。
3 网络热词舆情信息的采集、整理和特点分析
网络热词的采集和整理主要按照以下原则:一是,舆情信息采集整理的对象、信息源需要和网络流星体有关;二是,这些信息源包含网友、专家、学者的评论和观点;三是,要避免采集和整理的重复,确保数据的准确性。
网络热词的主要语言特点主要表现在以下方面:第一,时代性。网络热词的舆情信息是网友发出的评论。第二,模仿性。网络热词具有固定的词语和句式,网友在评论时进行模仿。第三,随意性。网络隐匿性的特点决定了网络舆情信息的随意性。第四,标点、字母、表情和数字符号较多。第四,口语化。第五,谐音化。
4 网络热词舆情信息的词语、句式和符号的倾向分析
从情感倾向的表达方式看,表达正面倾向主要是通过使用积极意义的词语、符号或是贬义词的否定形式,有时,句子的正面倾向还需要通过具体语境、上下文甚至语气词来表达,与负面倾向相比,固定格式较少。负面倾向的表达手段较多,可以借助否定结构、消极意义的词语、语气副词、程度副词、时间频率副词、疑问代词等来表达,有些语气副词在语料中甚至只表达负面倾向。这些表达方式使负面倾向具有不同的表达程度。中性倾向则主要是通过名词、疑问句、语气词等来表达,其内容上主要是陈述某个客观事实或单纯提出问题。在这些表达手段中,通过词语的褒贬性来判定正负倾向是最主要的方式,因而情感词语语料库的建设就显得尤为重要。
从总数上来看,无论是词语、句子还是标点、表情、字母数字符号,负面倾向的数量均多于正面倾向、中性倾向。词语中,副词总数上,正面倾向与负面倾向基本持平,其中语气副词、时间频率副词较多的表现为负面倾向,程度副词则正面倾向比较多,尤其是“很”,形容词中“所谓”的负面倾向占出现语料的3/5还要多,疑问代词 “什么”表达中性倾向与表达负面倾向基本持平。句子层面中,“被”字句、“把”字句和“使”字句总体来看在情感极性上负面倾向要强于正面倾向。标点符号中,连接号、句号的连用具有削弱语气的作用,能够表达一种俏皮活泼的情态,表情符号、字母数字符号则要根据其所代表的不同含义来判断正负倾向,虽然没有固定的情感表达式,但是却能从侧面为情感判断提供依据。
5 结论
在以后的工作中,为了让正负倾向的情感表达式具有更强的适用性,我们还需要扩展相应的研究领域,搜集不同类型的评论文本,归纳更详细的情感表达式,为计算机准确智能地识别说话人的情感提供了可能。
参考文献
[1]崔大志,李媛.网络评论情感语料库的构建研究[J].中国社会科学院研究生院学报,2010(7).
[2]黄伯荣.现代汉语[M].北京:高等教育出版社,2002.
[3]王治敏.基于现代汉语与发信息词典的词语情感评价研究[J].中文计算语言学期刊,2005(4).
关键词:网络热词;舆情信息;情感倾向
1 前言
随着互联网的发展,网络热词是近年来新出现的一种网络传播现象。网络热词的意义不仅是技术上的变化,也带来一系列新闻传播以及舆论监督方式的变化。從上世纪九十年代开始,文本情感倾向性研究逐步受到人们的关注并迅速发展起来,它涉及计算语言学中的多个领域,对于它的基本思路和关键技术,不同的学者有不同的观点。目前对于情感倾向分析的研究主要集中于文本情感分类的思路、技术、语料库和系统评测上,语言学上利用情感分析技术对网络评论文本进行分析的也多见于产品评论,如汽车、影视、音乐、手机等数码产品。网络热词舆情信息的态度倾向分析基本不存在,而对这一新兴语言现象进行情感分析的深入探讨能在一定程度上引导人们正确的使用网络流行体,也能为以后的语言学其他方面的研究提供情感态度分析的参考和整理,为其他学者进一步研究网络流行体提供依据,因而对网络热词舆情信息的语言学分析是十分必要的。
2 网络热词的传播内容及表现特征
笔者对来自百度百科、人民网、互联网热词、新浪网等机构或网站的年度评选,选择了300个网络热词。接着,从来源、领域、是否反映民意、是否反映热点、内容情感倾向等方面进行分析。来源上,主要来自“社会现象”、“新闻事件”、“媒体娱乐产品”、“网络用语”、“故意误用”、“谐音”六个方面。分布领域上,主要分布在“时政领域”、“社会领域”、“生活领域”、“文化领域”、“经济领域”、“其他”六个方面。是否反映民意上,近65%的网络热词是民意的表达,网民创造网络热词,来表达对负面新闻和非正常社会现象进行监督和发表意见,是网民表达民意的手段。是否反映热点上,这些网络热词基本包含了40个当今社会的负面热点问题,如“权利腐败”、“食品安全问题”、“教育弊端”物价疯涨、“社会不公”、“暗箱操作”等民众强烈不满的热点问题,也是当今社会难以解决的热点问题。情感倾向上,对这些网络热词的情感倾向来看,贬义词占70%,中性词占25%,正面的很少。这也基本符合新闻媒体舆论监督的功能。
网络热词的总体特征为:一是,体现了批判为主的立场。网络热词敢于以批判的姿态对社会现实问题进行正视,利用网络平台进行监督、批判,以表达民意和体现王敏的参与意识。二是,民意表达色彩浓烈。三是,网络热词与热点问题联系紧密。
3 网络热词舆情信息的采集、整理和特点分析
网络热词的采集和整理主要按照以下原则:一是,舆情信息采集整理的对象、信息源需要和网络流星体有关;二是,这些信息源包含网友、专家、学者的评论和观点;三是,要避免采集和整理的重复,确保数据的准确性。
网络热词的主要语言特点主要表现在以下方面:第一,时代性。网络热词的舆情信息是网友发出的评论。第二,模仿性。网络热词具有固定的词语和句式,网友在评论时进行模仿。第三,随意性。网络隐匿性的特点决定了网络舆情信息的随意性。第四,标点、字母、表情和数字符号较多。第四,口语化。第五,谐音化。
4 网络热词舆情信息的词语、句式和符号的倾向分析
从情感倾向的表达方式看,表达正面倾向主要是通过使用积极意义的词语、符号或是贬义词的否定形式,有时,句子的正面倾向还需要通过具体语境、上下文甚至语气词来表达,与负面倾向相比,固定格式较少。负面倾向的表达手段较多,可以借助否定结构、消极意义的词语、语气副词、程度副词、时间频率副词、疑问代词等来表达,有些语气副词在语料中甚至只表达负面倾向。这些表达方式使负面倾向具有不同的表达程度。中性倾向则主要是通过名词、疑问句、语气词等来表达,其内容上主要是陈述某个客观事实或单纯提出问题。在这些表达手段中,通过词语的褒贬性来判定正负倾向是最主要的方式,因而情感词语语料库的建设就显得尤为重要。
从总数上来看,无论是词语、句子还是标点、表情、字母数字符号,负面倾向的数量均多于正面倾向、中性倾向。词语中,副词总数上,正面倾向与负面倾向基本持平,其中语气副词、时间频率副词较多的表现为负面倾向,程度副词则正面倾向比较多,尤其是“很”,形容词中“所谓”的负面倾向占出现语料的3/5还要多,疑问代词 “什么”表达中性倾向与表达负面倾向基本持平。句子层面中,“被”字句、“把”字句和“使”字句总体来看在情感极性上负面倾向要强于正面倾向。标点符号中,连接号、句号的连用具有削弱语气的作用,能够表达一种俏皮活泼的情态,表情符号、字母数字符号则要根据其所代表的不同含义来判断正负倾向,虽然没有固定的情感表达式,但是却能从侧面为情感判断提供依据。
5 结论
在以后的工作中,为了让正负倾向的情感表达式具有更强的适用性,我们还需要扩展相应的研究领域,搜集不同类型的评论文本,归纳更详细的情感表达式,为计算机准确智能地识别说话人的情感提供了可能。
参考文献
[1]崔大志,李媛.网络评论情感语料库的构建研究[J].中国社会科学院研究生院学报,2010(7).
[2]黄伯荣.现代汉语[M].北京:高等教育出版社,2002.
[3]王治敏.基于现代汉语与发信息词典的词语情感评价研究[J].中文计算语言学期刊,2005(4).