论文部分内容阅读
摘 要:以《汉语语义构词数据库》为基础,采用定性和定量相结合及演绎与归纳相结合的方法,对数据库中语义类为D类和A类的字位所构成的双音合成词进行研究,得出D+A构成的双音合成词的义类分布情况、特点及形成这种特点的原因,以期有助于进一步研究汉语语义构词规律。
关键词:字位 词义 义类 语义构词
一、前言
汉语构词法研究是汉语词汇学研究的一部分,也是汉语语法学较关注的问题。随着中文信息处理的发展,为使计算机更好地处理中文信息,人们对汉语构词法的研究又有了更多需求,也取得了许多研究成果。总的看来,学者们多着眼于语法形式研究构词法,揭示词的结构类型、构词的语素类型与词性之间的关系等。而基于语义的汉语构词法研究近年来刚起步,虽然也取得了一些成果,但总的说这些成果还不够细致。因此,面向信息处理的以大规模标注语料库为基础的汉语语义构词规则的研究和总结势在必行。
基于此形势,亢世勇教授首先按《同义词词林》的语义分类体系给“国标GB2312”定义的6763个汉字衍生出的17430个字位(所谓“字位”就是最小的语义构词单位,即形音义一体化的字,每个字位一形、一音、一义)分类,录入数据库,建成了《汉字义类信息库》;通过统计说明字、词语义分布情况及其对应关系;又以《同义词词林》为基础,结合《现代汉语词典》和《新词语大词典》,从中选取了52366个双音合成词,用计算机结合《汉字义类信息库》的信息给所选词的每个字标注义类标记和简单释义;最后,经人工校对,建成了《汉语语义构词数据库》(以下称数据库)。数据库采用以下语义类标记大类:A.人、B.物、C.时间与空间、D.抽象事物、E.特征、F.动作、G.心理活动、H.活动、I.现象与状态、J.关联、K.助语、L.敬语。在此工作的基础上再归纳,总结出了汉语双音合成词语义构词的具体规则,即同类规则、后向型规则、前向型规则和无向型规则。
我们知道,表抽象事物的词比表具体事物的词难理解,所以本文首先锁定了D类字位为研究对象。而数据库统计结果显示,多数字位都与人有关,所以对A类字位的研究也很有意义。
二、D+A双音合成词的义类分布
(一)大类
经统计,D+A构成的双音合成词共467个。其中,词义属于A人的有412个,占88.22%;B物的有6个,占1.28%;C时间与空间的有4个,占0.88%;D抽象事物的有31个,占6.64%;E特征的有7个,占1.50%;H活动的有3个,占0.64%;I现象与状态的有3个,占0.64%;J关联的有1个,占0.21%。按上述情况,可知:A人(412)>D抽象事物(31)>E特征(7)>B物(6)>C时空(4)>H活动(3)和I现象与状态(3)>J关联(1)。即,A类字位构词最多,J类字位则最少。而F类、G类、K类与L类字位则无。
(二)中类
以上是各标记大类在D+A构成的双音合成词中所占比例情况,下面进一步研究各大类下属的中类在该大类所占比例情况:
1.A中类在A大类中所占比例:词义属于Aa泛称的有15个,如国民,占3.64%;Ab男女老少的有7个,如报童,占1.70%;Ac体态的有6个,如天人,占1.46%;Ad籍属的有6个,如藏民,占1.46%;Ae职业的有76个,如戏子,占18.45%;Af身份的有73个,如衙役,占17.72%;Ag状况的有18个,如伤兵,占4.37%;Ah亲人、眷属的有57个,如长女,占13.83%;Ai辈次的有9个,如大婶,占2.18%;Aj关系的有57个,如情侣,占13.83%;Ak品性的有14个,如圣贤,占3.40%;Al才识的有41个,如文豪,占9.95%;Am信仰的有11个,如教皇,占2.67%;An丑类的有22个,如罪犯,占5.34%。可见,Ae在A类中所占比例最大,Ac和Ad所占比例最小。
2.B中类在B大类中所占比例:词义属于Bd天体的有阴宗一词,占16.67%;Bf气象的有2个,如京官,占33.33%;Bi动物的有2个,如元夫,占33.33%;Bp用品的有神主一词,占16.67%。
3.C中类在C大类中所占比例:词义属于Ca时间的有工夫一词,占25%;Cb空间的有3个,如幅员,占75%。因此,表示空间的词多于表示时间的词。
4.D中类在D大类中所占比例:词义分别属于Da事情、情况,Dd性能,De性格、才能,Df意识,Dj经济,Dk文教,Dm机构的都只1个,分别是:兆朕、户口、头角、意匠、法郎、卷宗、票庄,各占3.23%;Dh臆想物的有17个,如仙人,占54.84%;Di社会、政法的有5个,如义兵,占16.13%;Dn数量、单位的有2个,它们是:家口、人口,占6.45%。因此,词义属于Dh臆想物的最多。
5.E中类在E大类中所占比例:词义属于Eb表象,Ee德才的都只1个,分别是:满人、节烈,各占14.29%;属于Ed性质的有5个,如鬼工,占71.43%。
6.H中类在H大类中所占比例:词义全属于Hj生活,共有3个,如屈驾。
7.I中类在I大类中所占比例:词义属于Ib生理现象,If境遇,Ig变化的都只1个,如权舆、丧室等,都占33.33%。
8.J中类在J大类中所占比例:词义全属于Je影响,只有惠民一词。
三、D+A双音合成词的特点及形成原因
(一)D+A双音合成词的特点
亢世勇在考察了数据库中合成词的意义与构成该词的两个字位意义之间的关系后,得出了字义与词义的八种关系类型(A、B代表构成该词的两个字位):(1)A+B=A=B;(2)A+B=A;(3)A+B=B;(4)A+B=C;(5)A+B=A+B;(6)A+B=A+B+D;(7)A+B=A+D;(8)A+B=D+B。
由上文可知,D+A构成的双音合成词中,A类占88.22%,即D+A=A(A+B=B)占大多数。由于这种构词方式构词最多,因此,本文只探讨D+A=A这一典型现象。
第一,字位A由员、人、民、长等表人的字位构成;字位D由诗、词、党、军等表抽象意义的字位构成,它在字位A前,修饰字位A,表示该词所属的这类人的类别、职业、职务、特长等,有的也附带表示某种主观感情、形象色彩等。由于字位D表抽象意义,因此D+A整个词的意义偏向于由表具体意义的字位A承担。这类词在D+A构成的词中占了大部分。如党员、军长、诗人。
第二,字位D带有类似前缀的作用,即字位D是意义虚灵的语素,只起明示词的表义范围,有时也有表示某种主观感情、形象色彩等作用,D+A的意义还是主要由表实在意义的字位A承担。如魔王、仙人。
第三,字位D意义消失,D+A的意义主要由字位A承担。不过,字位D虽不表示什么意义,但在构成D+A整个词的结构形式上不可少,即D+A是偏义复词。如家室,“家”指家庭、家族,“室”指妻子,合起来后,整个词的意义指向“室”。
(二)形成以上特点的原因
社会生活的发展,包括新事物出现,旧事物灭亡,人的思想意识的发展;语言内部各个因素的相互作用。这三个方面是词义发展的主要根源,是互相影响,互相联系的。由于事物的发展是内外因共同作用的结果,因此,本文将D+A=A在D+A构成的词中占多数的原因归为语言的内部因素和外部因素两方面。
语言的内部因素上,是因为D类与A类字位组合时,前者的优势语法功能是作定语来修饰限制后者。因此D+A构成的词的义位其重心就落在了中心语即字位A上,而字位D的意义或者脱落,或者虚化。
语言的外部因素上,主要与“社会生活的发展”和“人的思想意识的发展”有关。一方面,“客体世界的变化发展是推动义位演变的第一动力”。社会在发展,客观事物也在不断变化;而人类在实践中又会与不断变化的客观事物产生联系,因此词汇中也会出现因客观事物的变化而带来的表人的新词汇。如党、团等组织以前没有,而电影、歌曲等也是逐渐出现的,人们与它们接触后,为满足交际需要,词汇中就产生了党员、歌迷等表人的新词。另一方面,“主体世界的变化发展,必定是推动义位演变的第二个动力”。人们可根据现有的表示某些事物的词,依据这种造词标准,推导出表示与该事物相关的其他事物的新词汇,如军长、师长、旅长、团长等。
参考文献:
[1]亢世勇.面向信息处理的现代汉语语法研究[M].上海:上海辞书
出版社,2004.
[2]符淮青.现代汉语词汇[M].北京:北京大学出版社,2004.
[3]张志毅,张庆云.词汇语义学[M].北京:商务印书馆,2001.
[4]张文华.基于数据库的汉语双音合成词语素义与义位关系类型研
究[D].鲁东大学,2006.
(雷蕾 山东烟台 鲁东大学文学院 264025)
关键词:字位 词义 义类 语义构词
一、前言
汉语构词法研究是汉语词汇学研究的一部分,也是汉语语法学较关注的问题。随着中文信息处理的发展,为使计算机更好地处理中文信息,人们对汉语构词法的研究又有了更多需求,也取得了许多研究成果。总的看来,学者们多着眼于语法形式研究构词法,揭示词的结构类型、构词的语素类型与词性之间的关系等。而基于语义的汉语构词法研究近年来刚起步,虽然也取得了一些成果,但总的说这些成果还不够细致。因此,面向信息处理的以大规模标注语料库为基础的汉语语义构词规则的研究和总结势在必行。
基于此形势,亢世勇教授首先按《同义词词林》的语义分类体系给“国标GB2312”定义的6763个汉字衍生出的17430个字位(所谓“字位”就是最小的语义构词单位,即形音义一体化的字,每个字位一形、一音、一义)分类,录入数据库,建成了《汉字义类信息库》;通过统计说明字、词语义分布情况及其对应关系;又以《同义词词林》为基础,结合《现代汉语词典》和《新词语大词典》,从中选取了52366个双音合成词,用计算机结合《汉字义类信息库》的信息给所选词的每个字标注义类标记和简单释义;最后,经人工校对,建成了《汉语语义构词数据库》(以下称数据库)。数据库采用以下语义类标记大类:A.人、B.物、C.时间与空间、D.抽象事物、E.特征、F.动作、G.心理活动、H.活动、I.现象与状态、J.关联、K.助语、L.敬语。在此工作的基础上再归纳,总结出了汉语双音合成词语义构词的具体规则,即同类规则、后向型规则、前向型规则和无向型规则。
我们知道,表抽象事物的词比表具体事物的词难理解,所以本文首先锁定了D类字位为研究对象。而数据库统计结果显示,多数字位都与人有关,所以对A类字位的研究也很有意义。
二、D+A双音合成词的义类分布
(一)大类
经统计,D+A构成的双音合成词共467个。其中,词义属于A人的有412个,占88.22%;B物的有6个,占1.28%;C时间与空间的有4个,占0.88%;D抽象事物的有31个,占6.64%;E特征的有7个,占1.50%;H活动的有3个,占0.64%;I现象与状态的有3个,占0.64%;J关联的有1个,占0.21%。按上述情况,可知:A人(412)>D抽象事物(31)>E特征(7)>B物(6)>C时空(4)>H活动(3)和I现象与状态(3)>J关联(1)。即,A类字位构词最多,J类字位则最少。而F类、G类、K类与L类字位则无。
(二)中类
以上是各标记大类在D+A构成的双音合成词中所占比例情况,下面进一步研究各大类下属的中类在该大类所占比例情况:
1.A中类在A大类中所占比例:词义属于Aa泛称的有15个,如国民,占3.64%;Ab男女老少的有7个,如报童,占1.70%;Ac体态的有6个,如天人,占1.46%;Ad籍属的有6个,如藏民,占1.46%;Ae职业的有76个,如戏子,占18.45%;Af身份的有73个,如衙役,占17.72%;Ag状况的有18个,如伤兵,占4.37%;Ah亲人、眷属的有57个,如长女,占13.83%;Ai辈次的有9个,如大婶,占2.18%;Aj关系的有57个,如情侣,占13.83%;Ak品性的有14个,如圣贤,占3.40%;Al才识的有41个,如文豪,占9.95%;Am信仰的有11个,如教皇,占2.67%;An丑类的有22个,如罪犯,占5.34%。可见,Ae在A类中所占比例最大,Ac和Ad所占比例最小。
2.B中类在B大类中所占比例:词义属于Bd天体的有阴宗一词,占16.67%;Bf气象的有2个,如京官,占33.33%;Bi动物的有2个,如元夫,占33.33%;Bp用品的有神主一词,占16.67%。
3.C中类在C大类中所占比例:词义属于Ca时间的有工夫一词,占25%;Cb空间的有3个,如幅员,占75%。因此,表示空间的词多于表示时间的词。
4.D中类在D大类中所占比例:词义分别属于Da事情、情况,Dd性能,De性格、才能,Df意识,Dj经济,Dk文教,Dm机构的都只1个,分别是:兆朕、户口、头角、意匠、法郎、卷宗、票庄,各占3.23%;Dh臆想物的有17个,如仙人,占54.84%;Di社会、政法的有5个,如义兵,占16.13%;Dn数量、单位的有2个,它们是:家口、人口,占6.45%。因此,词义属于Dh臆想物的最多。
5.E中类在E大类中所占比例:词义属于Eb表象,Ee德才的都只1个,分别是:满人、节烈,各占14.29%;属于Ed性质的有5个,如鬼工,占71.43%。
6.H中类在H大类中所占比例:词义全属于Hj生活,共有3个,如屈驾。
7.I中类在I大类中所占比例:词义属于Ib生理现象,If境遇,Ig变化的都只1个,如权舆、丧室等,都占33.33%。
8.J中类在J大类中所占比例:词义全属于Je影响,只有惠民一词。
三、D+A双音合成词的特点及形成原因
(一)D+A双音合成词的特点
亢世勇在考察了数据库中合成词的意义与构成该词的两个字位意义之间的关系后,得出了字义与词义的八种关系类型(A、B代表构成该词的两个字位):(1)A+B=A=B;(2)A+B=A;(3)A+B=B;(4)A+B=C;(5)A+B=A+B;(6)A+B=A+B+D;(7)A+B=A+D;(8)A+B=D+B。
由上文可知,D+A构成的双音合成词中,A类占88.22%,即D+A=A(A+B=B)占大多数。由于这种构词方式构词最多,因此,本文只探讨D+A=A这一典型现象。
第一,字位A由员、人、民、长等表人的字位构成;字位D由诗、词、党、军等表抽象意义的字位构成,它在字位A前,修饰字位A,表示该词所属的这类人的类别、职业、职务、特长等,有的也附带表示某种主观感情、形象色彩等。由于字位D表抽象意义,因此D+A整个词的意义偏向于由表具体意义的字位A承担。这类词在D+A构成的词中占了大部分。如党员、军长、诗人。
第二,字位D带有类似前缀的作用,即字位D是意义虚灵的语素,只起明示词的表义范围,有时也有表示某种主观感情、形象色彩等作用,D+A的意义还是主要由表实在意义的字位A承担。如魔王、仙人。
第三,字位D意义消失,D+A的意义主要由字位A承担。不过,字位D虽不表示什么意义,但在构成D+A整个词的结构形式上不可少,即D+A是偏义复词。如家室,“家”指家庭、家族,“室”指妻子,合起来后,整个词的意义指向“室”。
(二)形成以上特点的原因
社会生活的发展,包括新事物出现,旧事物灭亡,人的思想意识的发展;语言内部各个因素的相互作用。这三个方面是词义发展的主要根源,是互相影响,互相联系的。由于事物的发展是内外因共同作用的结果,因此,本文将D+A=A在D+A构成的词中占多数的原因归为语言的内部因素和外部因素两方面。
语言的内部因素上,是因为D类与A类字位组合时,前者的优势语法功能是作定语来修饰限制后者。因此D+A构成的词的义位其重心就落在了中心语即字位A上,而字位D的意义或者脱落,或者虚化。
语言的外部因素上,主要与“社会生活的发展”和“人的思想意识的发展”有关。一方面,“客体世界的变化发展是推动义位演变的第一动力”。社会在发展,客观事物也在不断变化;而人类在实践中又会与不断变化的客观事物产生联系,因此词汇中也会出现因客观事物的变化而带来的表人的新词汇。如党、团等组织以前没有,而电影、歌曲等也是逐渐出现的,人们与它们接触后,为满足交际需要,词汇中就产生了党员、歌迷等表人的新词。另一方面,“主体世界的变化发展,必定是推动义位演变的第二个动力”。人们可根据现有的表示某些事物的词,依据这种造词标准,推导出表示与该事物相关的其他事物的新词汇,如军长、师长、旅长、团长等。
参考文献:
[1]亢世勇.面向信息处理的现代汉语语法研究[M].上海:上海辞书
出版社,2004.
[2]符淮青.现代汉语词汇[M].北京:北京大学出版社,2004.
[3]张志毅,张庆云.词汇语义学[M].北京:商务印书馆,2001.
[4]张文华.基于数据库的汉语双音合成词语素义与义位关系类型研
究[D].鲁东大学,2006.
(雷蕾 山东烟台 鲁东大学文学院 264025)