异体字字库开发研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wangtian575
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异体字字库的开发问题一直困扰着我们,因为它牵涉到了异体字的数字化问题,异体字的整理问题,和字库的开发平台研究。本文以《第一批异体字整理表》为依据,对于学术界争论已久的异体字定义问题即采取狭义异体字还是广义异体字提出了基于整理层面的异体字研究和基于应用的层面的异体字研究,把《第一批异体字整理表》和《汉语大字典》、《康熙字典》、《说文解字》进行了对比研究,整理出了音义完全相同的异体字。在字库的开发中,我们采用了尉迟治平先生“字形”和“字位”的概念,遵守了国际Unicode组织一形一码的编码原则,试着探讨了异体字字库建设的相关问题。绪论部分主要介绍了异体字的整理和字库的开发现状以及本文的研究材料和研究方法。第二章主要从输入法的发展,字符集的不断扩大和数据库的发展三个方面介绍了数字化汉字字库的必要性和可能性。第三章先讨论了异体字的定义问题,了解了在异体字定义中最大的分歧是采取广义异体字和狭义异体字,然后我们通过观察一系列异体字整理表如《第一批异体字整理表》、《汉语大字典·异体字表》、《通用规范汉字表》,对它们在整理异体字的过程中所遵循的原则进行了解,深入的发掘了异体字整理中遇到的问题以及解决的办法,提出了整理狭义异体字的定义,即基于整理的一组狭义异体字是音义完全相同,而且不包括繁简字和姓氏字。第四章根据前两章的讨论,得到了基于整理层面的异体字字库开发,和基于应用层面的异体字库开发的观点,并以《第一批异体字整理表》为例,对它所收的异体字以组为单位进行了对比研究,对它所收的异体字进行了细致的描写和归类,并对归纳出来的音义完全相同的异体字试着进行了字库建设。最后是结语部分,归纳了全文的重点是提供一种可行的思路即基于不同层面的异体字整理办法。对异体字现象中的狭义异体字进行了整理,并试着为狭义异体字的字库建设做了介绍。
其他文献
目的探讨景观疗养护理对老年疗养员睡眠质量改善的效果。方法选取2016年7月~2017年6月在本院疗养的150例老年疗养员为研究对象。将其随机分为对照组与观察组,每组各75例。对两
主要研究双极结型晶体管BJT(Bipolar Junction Transistor)的Gummel-Poon模型在集成电路设计中的应用。用Gummel-Poon模型对BJT的一些非理想效应进行定量分析,包括基区非均匀
当前高校毕业生就业面临着十分严峻的形势,高校毕业生就业难已成为社会普遍关注的问题。本文通过分析高校毕业生就业难产生原因,并提出相应的解决对策。
我国的农村土地流转市场才刚刚起步,尚未形成成熟的农村土地价格评估体系。不动产登记可以在一定程度上解决土地数据支撑不足的问题,通过整合以前各部门分散的登记数据,完善
听歌曲,做游戏都是提升听力课堂兴趣行之有效的方法,而把电影引入对外汉语课堂教学具有更多的优势。当然,单纯的看电影,听力练习效果并不理想,学生更多的只是获得了感性认识,
矿山生产过程中机电设备是保证矿井安全生产的前提,随着机械设备的数量逐渐增多,其对应的管理问题也越来越严重。基于此,本文对现阶段矿井生产过程中机电设备常见问题进行分
期刊
作为反腐败体制机制的重要组成部分,纪检监察体制机制有力地支撑着权力运行制约和监督体系。纪检监察体制机制是否科学有效对进一步规范权力运行关系重大、影响深远。总体而
高校学生信息所具有的自身特点,增加了高校学生信息管理系统建设的难度,使得目前系统建设存在诸多问题,如信息系统设计仍基于传统的职能部门定位等。针对存在问题,应建立面向
由于传统银行对风险的严格控制,贷款难的问题一直制约着广大中小企业尤其是小微企业的发展。而我国的电子商务发展至今已进入成熟阶段,一些大型电商企业已经掌握了全面、丰富
论文以劳伦斯的著名小说《儿子与情人》为研究对象,采用理论分析和例证分析法,首先对小说中主要人物的语码转换的数量、类型、转换方向和目的进行探讨和分析。研究发现,该小