独词句使用的性别差异

来源 :安徽师范大学学报 | 被引量 : 0次 | 上传用户:chinababay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  关键词: 网络媒体监测语料库;独词句;性别差异
  摘 要: 以国家语言资源监测与研究中心(网络媒体分中心)建立的博客文本语料库为研究对象,对博客中在独词句使用上的性别差异作统计调查与分析。通过对普通名词、动词、形容词、叹词、代词等15个不同词类或不同性质的成分所构成的独词句的对比研究发现,男女性在博客中独词句的使用上表现出了一系列的共性与个性特征。
  中图分类号: H109.4 文献标志码: A 文章编号: 10012435(2011)02020305
  
  Sexual Difference on Use of One-word Sentence Based on Network Media Monitoring Corpus
  LI Xiangnong, TIAN Yuan, WANG Yubo (Center for Language and Language Education, Huazhong Normal University, Wuhan 430079, China)
  Key words: Network Media Monitoring Corpora; one-word sentence; sexual difference
  Abstract: Based on the corpora of blogs of male and female bloggers, established by the National Language Resource Monitoring & Research Center (Network Media), explore the sexual differences on the use of one-word sentence. Through statistics and analysis of 15 parts of speech, such as common nouns, verbs, adjectives, interjections, pronouns, etc, and comparative studies of one-word sentence composed by different compositions, conclude that there are many similarities and particular characteristics between the males and females.
  
  在20世纪60年代中期社会语言学的兴起和西方女权主义运动的带动下,语言学家们展开了有关语言使用中性别差异的研究。[1]“国内语言性别差异研究在30年中经历了一个从宏观到微观,从静态到动态,从现象罗列到理论升华、从理论引进到具体应用的发展过程”[2],虽然取得了一定的成果,但与西方学界相比仍有明显的差距,其中以中国大陆为样本的实证研究更是凤毛麟角。与其他领域的研究相比仍很匮乏。[1]
  学界关于独词句的研究更是少见。赵元任(1968)就认为“句子可以从结构上分为整句和零句(独词句)。”“ 零句最常见于对话以及说话和行为参杂的场合。”[3]42“在日常生活中, 零句占优势。”“从语用的角度看, 零句比整句更重要,对我们了解句子的结构也很有帮助。”[3]51
  本文以国家语言资源监测与研究中心(网络媒体分中心)建立在2005-2006年spaces.live.com;blog.sina.com.cn;blog.sohu.com;blogcn.com;bokee.com;blog.hexun.com;blogbus.com等7个知名中文博客网站的部分网页,共计4 938 041篇,1 937 732982字符次的文本语料为基础,提取出具有性别标识的博客文本共计2 275 826篇,606 571 001字符次(其中男性作者54 982个,文章773 777篇;女性作者77 007个,文章1 502 049篇)的博客语料库为样本作为研究对象,在对语料进行词性标注的基础上,将博客语料中男性和女性作者所使用的独词
  句提取出来,得到了一系列的数据,通过对数据的统计分析发现,男性和女性在博客中对独词句的使用呈现出了一系列特征。下面从不同角度对男女性在使用独词句时的特点进行分析。
  1 总体情况
  如表1所示,男性独词句句总数为2 877 591句,女性为2 854 148句,男性多于女性23 443,相对于庞大的独词句句总数而言,差量仅占女性独词句句总数的0.81%,男性和女性在独词句句总数上的差异并不明显。但通过对构成独词句的不同词类的分析,男性和女性在独词句内部存在着较为显著的差异。
  2 不同词类构成的独词句
  我们将独词句按照构成成分所属的词类[注:此处的“词类”准确地说应该指不同性质的成分,其中除了包括传统意义上的名词、动词等,还将成语、缩略语等与传统意义上的词类并列起来,为了行文方便,我们统称“词类”。]进行分类,分别提取了男性和女性使用普通名词、动词、形容词等15种词类所构成的独词句。
  表2列出了男性使用15种词类所构成的独词句的句总数,其中构成句总数最多的两个词类是普通名词和动词,句总数分别达到了726 884和572 540,而句总数最少的两个词类是缩略语和机构名,句总数分别只有27 667和23 679,排在第一位的普通名词的句总数是最后一位的机构名的30.70倍。总的来说,除了句总数最多的达到50万以上的2个词类之外,超过20万的是人名和叹词2个词类,10万到20万之间的是时间名词、形容词、成语、习语、代词、地点名词和拟声词7个词类,低于10万的是动名词、专有名词、缩略语和机构名4个词类,其中前3位之间在句总数上的跨度较大,其余一些词类之间的跨度相对较小,这种趋势从图2中可以清楚地看到。
  图1 男性不同词类构成的独词句句总数分布
  同时,我们也对女性独词句所使用词类的情况进行了统计分析。和男性一样,构成独词句最多的词类是普通名词和动词,句总数分别达到了647 081和587 214;句总数最少的则是专有名词和机构名,分别只有28 761和11 655;另外句总数超过20万的两个词类是叹词和形容词,相对于男性来说,女性使用了相对较多的形容词构成独词句;句总数在10万和20万之间的词类相比男性的7个词类少了地点名词;而句总数低于10万的词类则相对多了地点名词。对照图1和图2发现,女性和男性在独词句句总数的分布上表现出了相似的特点。具体数据见表3。
  3 男女性不同词类独词句使用总体情况的对比分析
  为了对比男性和女性在不同词类所构成的独词句使用上的总体情况,表4将男性和女性由同一词类所构成的独词句句总数进行了比对,计算出了同一词类构成的句总数差数d、样本和∑、平均值X和方差S2。
  差数d和所比较的总体呈正态分布是t检验的前提条件,因此我们首先用SPSS中的非参数分析方法Kolmogorov-Smirnov检验(下简称K-S检验)和正态概率图的Q-Q法对上表中的数据进行双重正态性检验。
  表5是运用SPSS中非参数分析方法K-S检验对普通名词、动词等15个词类所构成的独词句的男性句总数、女性句总数和男女句总数差数d三组数据进行的检验结果,从中可以看到,三组数据的p值分别为
  0.189、0.210和0.805,都大于0.05,因此上述三组数据都呈正态分布。
  由于男女两组数据是配对数据组成,因此要对其进行正态验证,只需验证他们的差值d是否符合正态分布。我们运用SPSS中正态概率图的Q-Q法对男女句总数差数d进行了正态性检验。图3中的散点基本上是聚集在固定直线的周围,因而可以认为数据资料近似服从正态分布。
  上述正态性检验结果证明上述15个词类所构成的独词句数据为正态性分布,满足进行成对文本t检验的前提条件。
  根据表4中的数据,我们进一步进行了t检验:成对双样本均值分析
  设显著水平为0.05,t分布表中临界值为2.145(df=14)
  n=15,df=n-1=14, t=dSdn=0.217
  由于t=0.127<t0.05(14)=2.145,说明就上述词类所构成的独词句整体来说,男性和女性在这些词类的独词句句总数上的差异不明显。
  4 男女性不同词类独词句的使用差异
  通过上文中的统计分析,可以发现,男女性之间在独词句的整体使用上存在着一定的共性。但男性和女性在不同词类构成的独词句使用上表现出了明显的差异。
  表6列举出了普通名词、动词、人名、叹词、时间名词、形容词、成语、习语、代词、地点名词、拟声词、动名词、专有名词、缩略语和机构名等15种词类所构成的独词句的句总数,其中普通名词和动词是构成独词句的重要组成部分,其句总数远远大于其他词类,这是男性和女性的一个共性;具体到同一词类,男性和女性由同一词类构成的句总数差异较大,在上表差量和比例两栏中,正数代表男性多于女性的量及差量所占女性总量的比例,负数代表男性少于女性的量及差量所占男性总量的比例。
  从表6可以看到,男性和女性在同一词类所构成的独词句的句总数上存在着较大差异,我们将男女性同一词类的独词句句总数单独提取出来,得出图4,从中可以清楚地看到:在比较的这15种词类中,就句总数之间的差异量的大小来看,男性和女性叹词和拟声词的句总数上差异最大,女性远远多于男性;而男性在由普通名词和人名所构成的独词句句总数上较为明显地多于女性;除此之外,男性和女性在其他词类构成的独词句句总数上也存在着或多或少的差异。
  有关男性和女性之间不同词类所构成的独词句在数量上的差异的特点,我们通过其他对比方法也得到了印证。表7将不同词类所构成的句总数和男性或女性独词句的总量相除,得到了不同词类句总数所占男性或女性独词句总数的百分比,并利用这些比值生成了图5,从图4和图5,我们得到了反映出相同特点的曲线图。另外,图6和图7形象地展示出了普通名词和动词所构成的独词句在男性和女性中的主导地位,二者共占了将近50%,而其他13个词类则共占了50%多一点。
  但是,仅仅从句总数之间的差异量的大小来判断男性和女性在独词句使用上的差异是片面的,因为有的词类所构成的独词句句总数非常大,男女之间的差异量的数字也大,但这个差异量相对这个词类所构成的句总数而言所占比例却很小;因此,在表4中我们不仅列出了男性和女性在同一词类所构成的句总数上的差量,并且计算出了这个差量相对于男性或女性这同一词类的句总数所占的百分比,即差量比例,我们将这个差量比例与差异度联系起来,差量比例越大,差异度越大;反之,差异度越小。
  差量比例=|男性某词类句总数-女性某词类句总数|男女性某词类独词相对减小的句总数
  我们将男性和女性不同词类所构成的独词句的差量比例单独列出,并按倒序的方式排列,可以明显地看出男性和女性在使用某一词类构成独词句时的差异度。
  从表8可以看到,总体来说,男性和女性独词句在不同词类上存在着显著差异,其中差异度较大的不是我们上面提到的男女性之间差量最大的拟声词和叹词或者句总数最大的普通名词和动词,而是句总数最小的词类机构名;其中差量比例最大的达到了103.17%,最小的则不到3%;具体来看,在机构名所构成的独词句的数量上,男女之间的差异最大,其次是差异比例超过了40%的拟声词、地点名词、叹词和专有名词,其他词类男女之间的差异比例从低于10%到百分之三十几不等。这种男性和女性在不同词类上的差异度情况通过下面的曲线图可以明显地看到,差异度跨度很大,差异度大的超过了100%,小的则只有百分之二点几,而且差量比例低于20%的词类有9个,占了60%,超过了半数。
  5 结论
  男性和女性在独词句的使用上表现出了相似的特点。首先,独词句句总数的差异不明显;其次,按照词类来分的话,普通名词和动词所构成的独词句都占据了前两名的位置,并且所构成的句总数远远大于其他词类;第三,按照不同词类构成的句总数的量来看,15种词类中除了地点名词之外,男性和女性之间在句总数的分布上基本表现出了相似的特点。
  同时,男性和女性在使用不同词类构成独词句时又各具特点:首先,同一词类所构成的独词句句总数及所占比例男性和女性各不相同;其次,男性和女性在使用不同词类构成独词句时,词类与词类之间句总数的差距非常大,而且这种差距的大小并不完全与某一词类所构成句总数的大小一一对应;第三,男性和女性在使用不同词类构成的独词句时表现出了不同的差异度,根据我们对差量比例的计算,得出了差异度曲线图,其中男女性之间差异度最大的是机构名所构成的独词句,差异度最小的是动词构成的独词句。
  
  参考文献:
  [1] 周浩,赵光年. 近十年国内语言性别差异研究概述[J]. 当代教育论坛,2009,(12):26-27.
  [2] 史耕山,张尚莲. 国内语言性别差异研究概述[J]. 外语教学, 2006,(3):24-27.
  [3] Chao, Yuen Ren. A Grammar of Spoken Chinese[M]. Berkeley & Los Angeles: University of California Press, 1968 .(又参考:吕叔湘节译本《汉语口语语法》,北京:商务印书馆,1979)
  责任编辑:凤文学
  注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文
其他文献
关键词: 《夏与烟》;“二重身”;剧变的内涵 ;田纳西威廉斯  摘 要: 通过文本细读以及广泛联系作家的回忆录、访谈、书信和传记,结合弗洛伊德相关理论,揭示田纳西威廉斯最喜欢的人物,即《夏与烟》中的阿尔玛,从一个模范的清教徒淑女突然转变为荡妇的原因,挖掘阿尔玛与作家的深层联系,在颠覆了从道德角度对《夏与烟》以及主人公阿尔玛进行理解的基础上,指出阿尔玛以及她一直心仪的约翰并非一般人物,而代表着威廉斯
期刊
关键词: 产出性知识;三类习语;中国英语专业学生;二语习得  摘 要: 习语总产出性知识和英语水平具有显著正相关性,随英语水平的提高而显著增长,其中习语拼写知识和英语水平的正相关性最高,拼写知识的增长要快于语域知识和同义词知识;三类习语总产出性知识在不同英语水平层次上存在显著差异,人际习语总产出性知识最多,其次是关系习语,最后是概念习语;概念习语总产出性知识对英语水平的影响最大,可以预测英语水平。
期刊
关键词: 村社组织;工分制;博弈结构;激励相容  摘 要: 集体化时期的农业生产低效率的原因是农产品价格和生产计划控制制度内存在激励不相容,偷懒实际上是农民对资源优化配置的理性反映。林毅夫关于退出权导致偷懒并引发了生产效率低下的结论是错误的。  中图分类号: F30 文献标志码: A 文章编号: 10012435(2011)02013009    Efficiency of Agriculture
期刊
关键词: 锺鼎文;诗美;意象主义;艺术次序;审美思维  摘 要: 锺鼎文对诗歌最独特的贡献在对雕字琢句的审美。他的潜伏着的文思,苞放着意蕴与奇妙的诗才;而形象的联想、艺术形式的生动,也往往使读者沉入美感的艺术世界。    中图分类号: I227  文献标志码: A  文章编号: 10012435(2010)02016800  An Analysis of Zhong Dingwen's Poems
期刊
关键词: 李则纲;史学通论;史学功能;史家修养  摘 要: 皖籍著名历史学家李则纲在20世纪30年代接受马克思主义唯物史观,重新审视了历史学的功能,强调史学应以唯物史观为基础融通其他学科,培养史家的科学精神,正确认知历史和传承人类文明,更新史学的社会教化功能,适应新的时代要求。他的史学功能观对我国史学的进步具有积极的意义。  中图分类号: K092 文献标志码: A 文章编号: 10012435(
期刊
关键词: 元稹;律赋;革新  摘 要: 律赋作为唐代科举考试文体之一,受到士人们的高度重视,并于中唐达到兴盛的局面,成为唐赋中数量最多的一体。然而,过于程式化的写作要求,其弊端也显得非常突出。元稹作为诗文大家,在中唐诗文革新大背景下,与好友白居易一起,旁骛别趋,不受拘束,放笔直干,以古赋为律赋,以其积极的文体革新精神为唐代律赋创作开辟了一个崭新的境界。  中图分类号: I207.2  文献标志码:
期刊
关键词: 薇拉凯瑟;南方主题;南方特质;南方情怀  摘 要: 薇拉凯瑟在弗吉尼亚度过了她生命中最初的九年。她的作品中不乏南方主题。然而评论界对此  一向冷漠。通过解读她的三部南方小说,对它们的南方主题进行梳理,指出南方特质和南方情怀其实早渗透到凯瑟的心中,并深深地影响了她的创作。    中图分类号: I712.06  文献标志码: A  文章编号: 10012435(2010)02024504  
期刊
关键词: 诗僧;僧诗;诗情;道性  摘 要: 作为诗人,诗僧们不能回避诗歌的本质要素——情,而作为僧人,他们的创作又要引人见“性”,但“情”与“性”对佛教修行者来说势如水火,因此诗僧经常处于诗情与道性的矛盾之中,僧诗的合法性也成为唐代教内外讨论的热点。“诗情”与“道性”之间的张力,在僧诗题材的选取、物象的创设、意境的营构等方面都起着决定性的作用。  中图分类号: I207.2  文献标志码: A 
期刊
关键词: 韩愈; 诗歌; 赋  摘 要: 诗史上被称作“以文为诗”的韩愈,他的“大变盛唐”,既表现在将散文的某些因素融入诗歌,亦表现在融赋入诗方面。韩诗的铺排夸张、谐隐滑稽、联句赋物,皆与融赋入诗相关。对于参用其他文体的韩愈诗歌,在鉴赏和批评方面也应有跨文体意识。  中图分类号: I207.2  文献标志码: A  文章编号: 10012435(2010)02014609  Han Yu’s Ab
期刊
关键词: 江南;近代;农家经济结构;转型;无锡县    摘 要: 经济结构的转型是近代江南农村经济转型的一个重要方面。市场化和现代机器的侵入与一家一户的农桑结合型经营相交织构成了转型时期江南农村经济结构的特有形态;近代江南农家以稻作为主、以蚕桑为辅的生产格局并未发生根本的改变;多种经营和“非农化”是农家经济结构发展的基本趋势。  中图分类号: K25  文献标志码: A  文章编号: 100124
期刊