基于词频统计的汉语缩略研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:fdiskhotmail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语缩略语是汉语发展与表达中的一种常见的词汇现象。它是由意义相同但音节数量较多的语言单位,即原词语缩略而成。当前对汉语缩略语研究的关键问题集中在缩略语的界定、省时性、词义的精确性及使用频次等方面。文章在以上问题的导向下,以汉语缩略语词典中的缩略语与原词语为对象,在自建的大规模语料库中进行词频统计并加以对比分析,总结缩略语与原词语词频的共时性特征。同时,从历时性的角度深入分析汉语缩略与原词语频次的演变。最后,在以上研究的基础上,概括汉语缩略语产生的主要动因,并总结缩略原理,发现汉语缩略语的缩略原理与霍夫曼编码原理相似。本文分为六个部分:第一章为现代汉语缩略语研究现状的回顾,同时梳理缩略语研究中几个关键问题。在此基础上,介绍本文的研究目的、意义、思路与方法。第二章为汉语缩略语与原词语的关系及缩略原则的研究。本章从语义、产生时间、构造形式等方面分析了两者的关系,总结出缩略时需要遵循的原则。第三章为汉语缩略语与原词语的词频分析。本章分为四部分:第一部分简要说明汉语缩略语的选词来源及语料库建设;第二部分对词频统计与其研究现状进行概述,并通过实验对比计算机分词统计与人工分词统计的结果,验证计算机统计的准确率;第三部分根据词频统计的数据对比,分析缩略语频次与原词语总频次的关系,从而得出词语频次越高,音节越少,越容易缩略的结论;第四部分就少数不符合上述结论的特殊现象进行分析。第四章为汉语缩略语与原词语使用频次的历时态分析。本章首先介绍了语言历时研究的现状,其次对建立的大规模流动语料库的内容及特点进行说明。最后根据汉语缩略语与原词语在频次上会逐年变化的特点,以十年为一个阶段,分析缩略语与原词语频次变化,总结现阶段缩略语与原词语的关系。第五章为汉语缩略语的缩略动因与原理的总结。首先从已有研究成果及本文实验数据可以分析出:"省力原则"是缩略语产生的主要动因;然后根据霍夫曼编码的特点,在前两章实验数据的基础上分析缩略原理,发现缩略语的产生与信息论中的霍夫曼编码原理相同,都体现了频次高,编码短的特征。同时,缩略语频次与音节多少也有关联,从侧面证明了霍夫曼编码原理在语言学领域的实践。第六章为结语。本章梳理了文中的主要内容,指出了研究工作中有待改进的地方,并对未来工作的开展进行展望。文章通过实验方法分析缩略语与原词语的频次特点,从一个新颖的角度探索信息论与缩略原理的关系,为缩略语研究和计算语言学适用性作了有力补充。
其他文献
如今,理论界和实践界都意识到战略对企业发展的重要性。但是在高层的战略目标总是没有转化为现实的时候,大家都觉得还缺少点什么,这就是“执行”。对于战略的重要性,人们已经有了
教育发展亘古不变的核心是教育对像的"思考力建设","思考力建设"是教育"有效"与"高效"的基本保障。可以说没有什么教育改革能够绕开教育的"有效"与"高效"这两座大山而能顺利
智能移动机器人,是一个集中了环境感知、动态决策与规划、行为控制与执行等多功能于一体的综合系统。它综合了传感器技术、信息技术、电子技术、计算机技术、自动化控制技术
末位淘汰制度是否合理合法,在人力资源管理工作和司法实践中一直存有较大争议。首先从微观、宏观的视角分析末位淘汰制度的管理学基础和法理基础;然后,探讨末位淘汰制其他模
有这样一个故事,一天,数学家波利亚碰到一个物理学家,他问这个物理学家:“给你一个煤气灶,一个水龙头,一个空水壶,让你烧一满壶开水,你应该怎么做?”物理学家回答:“把空水壶
地铁施工不可避免的要穿越大量既有地下管线,引起周边土体变形,导致管线产生附加应力和变形,对管线的安全使用具有潜在威胁。以北京地铁7号线湾达区间施工竖井为背景,利用FLA
本文采用健脾疏肝法治疗功能性消化不良餐后不适综合征(PDS)40例,现报道如下。1一般资料选择2016年4月一2017年11月符合上述病例选择标准的PDS患者80例,随机分成两组各40例。治疗
<正>自信息技术和相关设备发明以来,就不断有人声称"隐私的终结",例如照相机和摄像头便利了偷拍和监控、电报和电话则容易遭到窃听、计算机的出现导致"数据库国家"的出现,等
本文阐述了第三方物流服务质量评价指标体系的构建。选取了服务绩效、服务过程和服务能力等三大方面的指标来对第三方物流服务质量进行评价,并运用德尔菲专家意见法对各个指
在一个国家经济的发展中,矿产资源发挥着基础产业的地位,对于一个国家的发展意义重大。矿产资源的储备和供给水平,是一个国家富强的关键。随着国内外市场经济的发展,矿产资源短缺