【摘 要】
:
语言的使用方式和使用的词语,反映了个体的很多心理特征。例如认知思维方式,情绪状态,人格,幸福感,社会满意度等等。针对英文文本内容分析的系统LIWC(Linguistic Inquiry and
【机 构】
:
中国科学院大学; 中国科学院心理研究所;
论文部分内容阅读
语言的使用方式和使用的词语,反映了个体的很多心理特征。例如认知思维方式,情绪状态,人格,幸福感,社会满意度等等。针对英文文本内容分析的系统LIWC(Linguistic Inquiry andWord Count),已被众多研究者广泛用于个体文本的心理分析。LIWC系统由文本分析软件和词典组成。词典中的词语被划分为80多个类别,其中包括语言使用特点,心理特征等。然而,很遗憾的是在笔者最初尝试使用LIWC软件做新浪微博文本内容分析时,并没有针对简体中文的LIWC词典。笔者及同事,同招募的被试共同建立了符合LIWC词典结构的简体中文LIWC词库。并且,在针对正式语言的简体中文LIWC词库词典的基础上,通过标注和信效度检验等过程,扩展了4693个新浪微博高频词,建立了简体中文微博心理词典。然而,词库的建立和扩展,没有对微博内容文本的分析结果达到预期的提升。在分析LIWC软件计算结果时,笔者和同事发现LIWC软件虽然支持简体中文字典的扩展以及使用,但LIWC软件程序最初就是针对英文进行的设计和编码开发。因此,使用LIWC软件分析中文的时候,会出现诸如标点符号识别,文本语料中句子的数量,和通配符不合理匹配等问题。另外,LIWC软件分析文本内容的方式是针对较为规范的文本的,LIWC软件对类似新浪微博这样网络文本的分析会受到类似超链接和"@"符号影响。这些符号在微博语境下有其特殊含义,并非仅仅是一个特殊符号。在本文的研究过程中,笔者和同事开发了一套针对中文的语言心理分析系统。系统由分析软件和中文语言心理分析词典组成。分析软件针对中文设计,可恰当识别中文标点符号,并且可以根据标点符号出现的位置,计算符号作为句子停顿,句子结束等语言现象的特征。中文语言心理分析词典则涵盖了正式书面用词、口语常用词以及微博网络用词。并且词典中的每一个词项均标注了语言和心理类别特征。中文语言心理分析系统为基于文本内容的个体或群体心理特征的分析提供了一种高效的方法。
其他文献
自2000年网络游戏被互联网界正式承认至今,短短16年,我国网络游戏以令人惊叹的发展速度和产值跃居世界第一,成为推动国内网络经济腾飞的中坚力量。伴随着网络游戏从萌芽到成
随着素质教育模式的不断深入,为新时期中职学校教育开展创造了有利条件,确保学生素质可以得到大幅提升。本文根据以往工作经验,对中职学校机械制图教学中CAD应用问题进行总结
Rap1(Ras related protein 1,Ras相关蛋白1)分属小G蛋白Ras超家族,其作为一种重要的分子开关,广泛表达在各类组织中,参与调控细胞的黏连、极性及增殖等。在神经细胞中,Rap1会
在国家政策助推和巨大的市场需求下,通信设备制造业迎来机遇的同时,也面临更严酷的挑战。所以,有必要重点聚焦通信设备制造业企业并深入研究其财务风险。ZX公司作为我国通讯行业的龙头企业,由于受到美国制裁,2016年和2018年两年净利润均为负值,财务风险急剧加大。ZX公司这一案例具有一定代表性和典型性。因此,本文旨在ZX公司为研究对象,基于现金流量视角,对ZX公司的财务风险进行分析,发现其财务风险发生的
知识产权已成为独立的不可或缺的重要生产力要素,在社会经济发展中起决定性作用。而知识产权经济是一种产权化知识,可以创造超额收益和差异化竞争优势。本文通过对知识产权经济
以协同管理为理论基础,围绕高校辅导员队伍建设的现实状况与问题,对其基本原则与系统构成进行了详细探究,进而结合教育新形势提出了高校辅导员队伍建设的路径,旨在提升高校辅
我国的代理制度主要体现在《民法通则》和《合同法》的规定中,为了适应社会的发展及受西法东渐的影响,我国代理制度已从直接代理的时代过渡到直接代理、隐名代理与不公开本人
第一部分神经生长因子对哮喘大鼠细胞因子及肺MUC5ac表达的影响目的观察卵白蛋白(OVA)诱导建立的急性支气管哮喘大鼠,研究神经生长因子(NGF)处理后大鼠血中细胞因子的变化情况及
由脊髓损伤或者神经病变引起的瘫痪对病人的日常生活造成了重大影响。针对瘫痪康复的现实与急迫需求,国内外已有很多研究机构致力于瘫痪康复方面的研究。基于微型机电系统(Mi
<正>数学思想,就是对数学知识的深入理解和认识,指导学生进行数学行为的意识。数学作为一种解决问题的有效工具越来越受到人们的重视。作为承上启下的初中数学,更应该担负起