基于语料库的留学生高频字词偏误分析

被引量 : 0次 | 上传用户:peterkong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字——作为世界四大古文字之中惟一一个流转至今却保持鲜活的文字,其文字量和词汇量都非常庞大。并且由于汉字形、音、义三位结合的特点,留学生在学习汉语作为第二语言的时候,普遍感觉到汉字和词语学习的困难。高频字词的研究能够帮助留学生更快更好地走进并熟悉汉语世界。中国人日常使用频度最高的覆盖率高达50%的共计587个字词。准确快速地掌握这587个字词(其中包括汉字偏误226项和词语偏误361项)是留学生快速高效学习汉语的通道,而研究留学生使用这587项字词的偏误情况则是打开这个通道的最佳钥匙。汉字偏误指汉字书写过程中产生的与目标汉字字形和使用所不符的情况。词语偏误是指词语在使用过程中与目标词语用法不符的情况。字词偏误都可归类为错、漏、多三大类。具体而言,汉字偏误可以细化为错字、别字、漏字、多字四个类别。而词语偏误可以细化为错词、漏词、多词三大类。在错、漏、多三大偏误类别中,占比最多的是错误使用,其占比高达87%,也就是说在留学生使用汉语高频字词的时候,将目标字词错误使用成其他字词的情况最为严重。汉字偏误共计226项。偏误中错字数和别字数占比最高,总计占比错误率的近93%,是留学生错误频发的焦点。而汉字偏误又和笔画及部件紧密相关。从笔画角度看,高频汉字的笔画数主要集中在4~6和7~9两个区间,各笔画区间的偏误率与高频汉字笔画数成正比,即偏误集中于4~6和7~9两个区间。从部件角度看,汉字项半数以上集中于两个部件的组合。词语偏误总项共计361项。其中错词数占总误词数比例最高,为69.45%,是留学生词汇错误频发的焦点区域,需要教学者、学习者和研究者的高度重视。按照词性将词汇偏误情况作进一步分类统计,实词的项数为323项,占比85.68%。虚词的项数为54项,占比14.32%,高频字词中实词的项数远多于虚词。从总体偏误情况看,实词中误词占比最高的三项依次为动词、名词、代词;虚词中误词占比最高的三项依次为连词、副词、介词。从偏误类别看,高频核心汉字的偏误原因可以归结为因笔画问题导致的偏误、因部件问题导致的偏误、因结构问题导致的偏误和因整字问题导致的偏误等四个类别。高频核心词语的偏误类别可以归为词语拆解、同字组词、义近误用、搭配错误、理解方向错误和其他等六大类偏误。两者的偏误原因都可以归结为四个方面,即汉语本身的特殊性和复杂性、学生学习态度和策略的选择、母语迁移因素以及目前对外汉语教学的不足等。
其他文献
本试验于2010年-2012年在山东农业大学试验站高产田内进行,以606为试验材料,研究了钙、硫肥不同用量及配比对花生生理特性、产量和品质的影响。主要研究结果如下:1钙肥不同用量
随着大数据时代的到来,数据开始呈现爆炸式的增长,越来越多的互联网用户被淹没在数据的海洋中。因此,如何从海量邮件中快速检测到含有敏感信息的邮件已经成为目前亟待解决的问题
<正> 一、机床概况目前对于磨削较大规格(M2.5以上)的丝锥和圆锥管螺纹丝锥等,一般都在万能型或普通型螺纹磨床上加工,由于这种丝锥的批量较大,因此在万能型或普通型螺纹磨床
近些年来,钛合金和碳纤维复合材料(Carbon Fiber Reinforced Plastic,简称CFRP)因其优良的物理机械性能被广泛用于航空航天领域。然而,它们均属于典型的难加工材料,对刀具的切削
本文介绍了取0.1000克试样,加50毫升水,10毫升盐酸,2毫升冰醋酸及1克硼酸溶解试样,分液后用氨水调节酸度,然后加ZnO分离除去Fe、Al、Ti等元素干扰,取部分滤液,用氯氧化锆-二
固定资产是我局贯彻执行国家、省有关房产管理、住房改革制度及相关活动的重要物质保证。单位固定资产设备是否充裕,很大程度决定是否反映了事业单位的服务水平,且固定资产在
本研究的对象L公司是以代理销售世界知名工程机械和动力系统业务为经营导向的中型外资企业,其研究的目的是在于为L公司建立一套基于平衡计分卡的营销人员绩效管理体系,使其能够
在集团公司中,普遍存在规模效益不佳、财务监控不到位、资金运营效率低等问题,因此,如何管理好企业集团、发展企业集团,是现阶段我国政府及企业集团的领导层所面临的重要课题
目的调查冠心病患者危险因素的基本状况;探讨冠心病患者心理一致感,A型行为模式与心理健康三者之间的关系,探寻冠心病患者出现心理健康问题内在机制,对冠心病患者进行有效的
近年来,邻避抗争成为我国城市环境抗争的重要类型。邻避意指“别在我家后院”,是由台湾学者根据NIMBY意译而成。邻避抗争虽以反对一些具有公益性但不受欢迎的公共设施所引起,