论文部分内容阅读
本文以定量研究的方法,探究人们在微博中选词造句、组段成篇的规则。从海量、真实、动态的活语料中,抽取各语言单位的数量特征,对微博的词、句、段、篇、语体风格进行全方位、多角度的观察,以厘清微博语言的整体特点。绪论部分首先运用文献计量的方法,对微博语言的研究现状进行综述:然后以文献中高频关键词为切入点,对部分代表性论文进行回顾;最后对本研究的意义、方法和创新之处进行说明。第一章谈“微博数据库”的建立,首先对语料的选择、处理和加工进行交代,确立录入原则和建库的9个信息要素,建立“微博总表”。其次基于“微博总表”,建立“词表”、“句表”、“分句表”和“依存句法树库”,为后面的语篇、词语、句子、分句及语体风格的计量研究打下基础。第二章对微博语篇的结构要素进行量化统计与数据分析。首先对微博语篇的话语角色和交际载体进行简要介绍,进而对微博语篇结构要素间的关系进行定量研究。其次,从宏观和微观两角度分析微博名的语言特色。最后,通过对微博话题的长度分布情况、标点符号分布情况、句子和分句分布情况的统计分析,归纳出微博话题在形式和内容上的特征。第三章分别从宏观、微观两个角度对微博的词汇、句子和分句特点进行考察。首先,通过对“词表”统计后所得的各类综合性数据的考察,从宏观上把握“微博词表”中词汇的整体面貌、构成情况和具体特点。其次,以“累加覆盖率”的计算、分析结果和笔者人工合成的部分代表性词语为基础,对词语进行“社会场”、“心理场”、“新媒介场”的集中划分,从微观角度得出微博特色标记语,并解析它们是怎样依附社会、表征心理和适应微博本身的。再次,从句数、分句数、微博长度三方面对微博中的句子进行全面的考量,从宏观上把握微博的句子特点和分布规律。最后,以“高频原则”为标准,利用计算机查询并调出能体现微博语言这一话语类型一般特性的标记性句子、典型句子,从微观上提供微博句子的某种范型。在这种范型的有机联系下,探索微博主体内容的系统化特点,总结出主体内容的部分结构类型。第四章首先以微博语言为主体,以博客语言相参照,通过计量特征在微博与博客语体风格比较中的应用,概括出二者在语体风格上的区别特征。其次,从语言风格的角度对语言规范问题提出看法。结语部分,概括出研究结论、说明留待解决的问题及进一步研究计划。