论文部分内容阅读
本文主要对通用规范汉字的构形属性问题进行研究。它属于现代汉字学的研究范畴,以《通用规范汉字表》的8105字为研究对象。基于现代汉字的特点和字理分析、形素分析、汉字结构拓扑分析等有关汉字构形分析的研究成果,我们提出了现代汉字的直观构形理论。它是以一般系统论为基础,采用上下文无关文法的描写方法,以部件、笔画间的拓扑关系为拆分依据,来分析现代汉字构形的理论,并在拆分过程中用系统论思想防止对汉字字形拆分的随意性。在此理论基础上,我们又提出了构建现代汉字直观构形分析与描写体系的理论构想。这是在直观构形理论下对现代汉字的整字、部件、笔画三级构形单位进行全面、系统描写的构形体系。在通过实验验证了现代汉字直观构形分析与描写体系具有现实可行性的基础上,利用该体系来对通用规范汉字的构形属性进行分析与描写。为了客观描述通用规范汉字的构形属性,利用数据库技术构建了通用规范汉字构形属性数据库。并基于该数据库对通用规范汉字三级构形单位的属性进行特征量化分析,基于量化分析结果,我们明确了通用规范汉字的整字、部件、笔画都有严密的系统性和规律性。简单来说,通用规范汉字主要有5种基本笔形、549个基础部件、8种构形模式,平均每个整字包含3个基础部件,每个基础部件包含6个笔画。具体来说,通用规范汉字整字虽然构形复杂:部件众多,层级及构形模式复杂,但规律性、倾向性明显。通用规范汉字虽然包含部件1995个,但是基础部件仅有549个,平均每个整字包含3个基础部件;合体整字虽然最多包含5个层级,但是1-3层级的合体字占优势(占95%);虽然合体整字包含472种初级构形模式、76种高级构形模式,但是只有8种高级构形模式占优势(占90%)。基础部件构形复杂:基础部件构字能力迥异,存在极值。合体字基础部件具有多功能性、多直接组合部件性、多分布层级性、多分布位置性,并且在组配合体字时会发生形变,但其规律性、倾向性明显。其中基础部件平均构字数为15个,具有组配合体字功能的基础部件占优势(占97%),合体字基础部件直接组合部件平均为20个,合体字基础部件倾向于分布在第一、第二和第三层级(占93%);只有少数基础部件(占22%)组配合体字时发生形变,其中左位置和上位置是基础部件形变的敏感位置。基础部件笔画构形复杂:附笔形内部笔形的长短、走势差异难以用言语表述,笔画顺序、基本笔形和附笔形之间的变化、笔形长短、笔画空间关系、笔画方位关系等变化多端,但是具有区别基础部件形体作用的笔画特征主要是5种基本笔形、9种附笔形和笔画顺序。笔形、笔顺可以区分70%(387个)的基础部件,而剩余30%(162个)的基础部件笔形和笔画关系复杂。而且,由于汉字的笔画、部件之间组合关系的非线性,使个体汉字的构形呈现出宜于直观(观察)、难以(形式)描述、无法(准确)言传的特点。通过本课题的研究,我们不但提出并验证了现代汉字直观构形理论、现代汉字直观构形分析与描写体系,明确了现代汉字整字、部件、笔画的构形属性,而且从理论和实践上证明了简化字没有违背汉字的科学性,进一步界定了现代汉字学和现代词汇学的研究内容。同时,本课题的研究也具有广泛的应用前景:它可以为汉字的构形属性提供形式化的描写方式,为非成字部件的命名提供依据,为汉字印刷字形规范提供素材,为汉字的整形提供借鉴,为简化字提供评价依据,为现代汉字教学提供帮助,为现代汉字手写规范的制定提供参考。当然,本课题只是对通用规范汉字构形属性的专门研究,不涉及字义、字音等属性,而且在通用规范汉字构形属性的综合计量分析方面做得较为粗浅。在应用研究方面,仅提出了一些应用的方向和应用的构想,它们都尚未经过实践的验证,尚不够成熟,还需要进一步深入研究。