基于分布信息的汉语词类获得研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:snowwonsnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于汉语缺乏丰富的形态标记和形态变化,词的分布特征是划分汉语词类的主要依据之一。由此看来,词的分布信息应对汉语儿童词类获得有重要的作用。本文研究了说普通话父母向儿童输入语言时,词的分布信息能否为语言获得提供可靠的词类信息,并评价了由高频框架提供的词分布信息对儿童获得词类知识的作用。这里的框架是指:语句中相继发生且中间有一个词分隔的两个词共同构成的结构。论文中使用的数据来源于对两名说普通话儿童的长期跟踪调查研究。数据之一是在儿童一岁两个月到二岁的年龄段中,父母向他们输入的22137个语句;数据之二是儿童从一岁九个月至两岁的年龄段中输出的2491个自发性语句。这些数据由四十个小时的录音录像材料组成。本论文的研究分为两个部分。第一部分通过对父母输入语句中出现的701个高频框架进行分析,得出结论,高频框架能够准确而高效地提供词类信息。首先,少量的高频框架提供了大量的词类信息。所有框架中不到3%的高频框架为父母话语中超过三分之二的词汇提供了词类信息。而且,高频框架的准确值和突显值很高。这说明,从高频框架里可以得出可靠的词类信息。同时,高频框架所突显的词类不仅有名词,动词和形容词等实词,也有诸如副词,助词等功能词。第二部分通过比较父母输入语句中的高频框架和居间词与儿童输出语句中的高频框架和居间词来评价分布信息对儿童获得词类的作用。研究对语言输出和语言输入中所共有的494个高频框架进行定量分析,发现:小孩语言输出中80%的高频框架以及这些高频框架中60%的居间词可以在父母的话语中找到,且这些高频框架在父母语言输入中的发生频率很高。同时,在语言输入和语言输出共有的高频框架中,输出语句中三分之二的框架所突显的词类与输入一致。这些结果表明:儿童在一定程度上能成功利用这种由高频框架提供的词类信息来获得汉语中不同词类的分布规则。另外,在儿童所构建的词类里,有近三分之一的词没有在输入语句里相应的词类中出现,这说明以词的分布信息为基础的汉语词类获得,并不是一种单纯的,以词汇为本的机械记忆。论文的研究结论为:用词的分布信息来引导儿童获得汉语词类的分布规则是一种可行的语言获得机制。儿童两岁前话语中出现的词类体现了其在成人语言中的分布。
其他文献
<正>有一天你可能不是在科幻影片《侏罗纪公园》里,而是在现实中,看见活生生的恐龙、猛犸象……现在,科学家利用新技术从化石中成功提取出古生物的DNA,这使追溯生物演化全过
目的:观察中药小青龙汤结合西医常规治疗对急性肺损伤和急性呼吸窘迫综合征(ALI/ARDS)的临床疗效并探讨其作用机制。方法:60例患者随机分成两组,治疗组30例,对照组30例。治疗组
本文采用国产6~8%Y2O3部分稳定的纳米氧化锆陶瓷团聚粉末,以NiCoCrAlY作为粘结层材料,利用等离子喷涂工艺,在GH3030高温合金基体表面制备了纳米氧化锆涂层。通过正交实验设计
实验研究了温度、pH值和Al3+、Zn2+、K+、Ca2+、Mg2+、Mn2+、Fe3+及Cu2+等几种常见金属离子对蜂房芽孢杆菌木聚糖酶活性的影响,结果表明该酶最适温度为40℃,最适pH为6.0.在低
运用文献资料、实践观察、信息访谈、逻辑分析等方法,探讨赫哲族篝火舞的艺术应用价值与民族象征,结果表明:赫哲族篝火舞及其文化在赫哲族渔猎生产劳动和图腾崇拜中产生,随着
在竞争性选举制度下.风险如何塑造选民投票行为,本研究通过引入"技能专有性"为投票理论提供新的解释框架.技能专有性分为通用型技能和专用型技能两类.由于专用型技能劳动者多
为在少量数据情况下显著提高方言普通话的识别率,针对标准普通话和方言普通话之间发音差异是连续变化的特点,在少量方言普通话的基础上,提出了基于距离度量的识别基元扩展方
IL-12是一种具有多种生物学活性的免疫细胞生长刺激因子,它能促进T淋巴细胞和NK细胞的分化与增殖,调控细胞免疫,提高NK/LAK细胞的杀伤功能和特异性CTL细胞的应答能力,诱导γ
本论文以英语和汉语的真实语料为基础,拟对空语类PRO在英、汉语中的照应性约束特征进行研究。论文的前半部分综述了照应性研究(主要是以英语语料为基础的)的历史:从NP短语的照