以“键盘输入法”为语料采集手段的身份指称的社会语言学研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:water11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文既是一项基于社会发展对于语言的研究,也是一项基于语言变化对于社会的考察。既是一项基于新技术的实验过程,也是一项基于海量数据的解释分析。从传统的“同志”、“小姐”到流行的“驴友”、“月光族”、“单身狗”等等表示身份的词语,我们发现它们的爆发式发展,已经成为当代汉语语言生活最显著的特点之一。这不但引起了社会越来越多的关注,而且也给语言学界提出了更为深刻的问题:问题一,任何研究都必须基于对于概念的有效界定,既有研究对于这类语言形式或称为“称谓语”,或称为“称呼语”,则,哪一种更准确,是否还可用其他方式表示?社会语言学不仅属于语言学,也关联着社会学,则我们的研究如何与社会学中的“身份识别”、“身份认同”、“身份紧张”等等问题衔接?问题二,语言研究离不开语料,既有研究的语料通常都是离散的(即使是一些带有系统性的研究也往往局限于某个小样本,如《红楼梦》专书才得以实现),则,面向海量数据的研究是否可能?语言生活每时每刻都在变化,既有研究却通常基于相对静止的语言材料(如某个语料库),则,即时性追踪每时每刻的语言系统性变化是否可能?既有研究的语料通常都是基于文献阅读(即使是语料库也主要基于文本阅读)采集获得,则,我们是否可能通过设计某种实验手段而获取?既有研究通常都是通过在语句中“摘取”词语的方式获得语料,则,既不依赖语句、语篇,又不依赖词典而“直接”提取词语作为语料是否可能?问题三,语言变化既是语言内部运功的结果,也是社会发展的某种表征,既有研究通常关注的只是这类词语对于汉语词汇学、语用学的意义,则借助语言统计与分析,建立辨识某种“即时性社会状态”的表征模型乃至建立某种基于语言统计的“社会问题量表”是否可能?本文的焦点就在于回应这一系列问题。首先,我们重新考察了既有研究习用的“称谓”与“称呼”概念,提出用“身份指称”涵盖“称谓”与“称呼”所表示的语言现象。语言作为最重要的交际工具,其主要功能可分解为指称、陈述、描写。人是社会性的存在,在社会交往中首要问题可描写为“我是谁”、“你是谁”、“他是谁”。所谓“身份指称”是指在语言中以语汇形式对于人的各自身份类型的指称。这表达了人们在文化语境中对于个人的社会经历、社会地位、社会价值的阐释和建构,既是语言生活的重要形式,也是社会变迁的一大表征。接着,我们在语言学研究中第一次设计了“基于键盘输入法的身份指称语料采集”的实验手段。中国网民达7.1亿(中国互联网络信息中心2016年数据)。“搜狗通用键盘输入法”是中国网民使用率很高的输入法,这一输入法会根据全国网民的使用而自动更新其词库的词语优先联想。这样,我们便可借助键盘输入来测量当下全国“搜狗通用键盘输入法”用户普遍使用的指称形式是哪些。由此,作为我们的语料搜集来源,论文以2015年1月2日搜狗键盘输入法词库为基础,通过追踪测量,建立了以这一动态词库为基础的“身份指称全数据语料库”。论文第一次采集到了前所未有的超大数量的身份指称形式共计13292个。其中,包括二字格身份指称6528个,三字格身份指称6764个。如此巨量的身份指称充分显示了当代社会身份识别与认同的空前多样性和复杂性。论文也第一次发现了数量高达500多个的身份指称“词语模”。为了在大数据量身份指称研究中分离出权重较高的影响因子,我们通过人工梳理,分析出所有身份指称中的“核心语素”,并由此发现了数量空前的身份指称“词语模”。如此数量的词语模的发现,不仅提升了语言学对于身份指称词语模数量的认识,并且,这种具有能产性的并如此高量的词语模的存在,也预示了身份指称总量在未来继续大规模膨胀的可能性。在对时间维度上的身份指称数据的前后对比分析中,论文不但观察到身份指称的动态性变化调整(身份指称年度隐显变化率约为200%)是社会语言发展变化的一个常态,而且观察到了身份指称所勾勒的与其时间维度相应的社会职业、社会心理和社会焦点等社会现象。为了更明确地认识在身份指称中所映射的当代社会问题,论文进一步集中考察了身份指称与中国社会权利与财富问题、身份指称与中国的性与性别问题、身份指称与中国的族群问题。论文发现,“社会分层”类相关身份指称映射出中国民众对社会的财富、权力以及与之相关的社会声望维度上的不平等的社会焦虑;“性与性别”类相关身份指称反映了中国社会在“性别维度”上具有男性化特征,其中,男性性别指称多映射中国社会贫富矛盾、官民矛盾、警民矛盾等社会重大议题,女性性别指称更多表现出女性炫富、炒作和任性等特点;“族群”类相关身份指称映射出中国“族群”的内外部分层,其中,民族歧视和“逆向歧视”是由事件性的社会力量推动而成的结果,而部分“族群”类身份指称体现了某些权力拥有者和社会普罗大众之间的分层、某些利益拥有者和普通网民之间的分层、某些非法获利族群与普通利益输送族群的社会分层。自然,这些社会问题都是处在变动过之中,而基于对全国网民输入习惯的“词库”变化的研究,也许可以为社会学“社会身份与社会冲突的焦虑度”的量表的构建提供一个基于语言学模型的思路。
其他文献
随着社会的不断发展,人们更加注重文化的培养,舞蹈不仅要考验舞者的形体,更是要达到洗涤心灵体现文化涵养的目标。舞蹈是一种感性的人文表达方式,舞者通过形体表现万物姿态,
已有研究发现,父母体罚与儿童问题行为之间存在密切关系,但多数研究主要从父母效应方向来考察这一问题。少数探讨两者之间双向关系的研究也主要关注父母体罚"水平"与儿童问题
谶言被认为是对未来的预见和宣告,其实它更多的是属于后人对过去文本所作的解释。这类作品开始并没有预示将来一定会发生什么事件,只不过后来发生的某种事件恰好可以与作品的内
<正>山区地少坡多,前期养山羊可以早期放牧,后期再进行肥育,养殖户需要做好放牧安排和放牧前的准备工作。一、放牧季节与时间牧草生长和气候环境因季节而异,因此,山羊放牧管
<正>9月10日,当马双成再次踏进北京中医药大学校园,参加母校60周年校庆时,心中难掩兴奋。是的,自1989年从原北京中医学院中药系毕业,已经过去了27个春秋。27年来,他一直在中
在认知无线电中,频谱共用是一种利于实现的通信方式,然而当主用户的功率较大时,认知用户将会受到很强的干扰。本文利用主用户和认知用户的功率信息,采用Rake高斯与串行干扰抵消的
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield