论文部分内容阅读
摘 要:一个汉字就是一个字节。字节由1个音素或最多4个音素组成。由于每个音素的发音方法和发音部位不同,又分为元音和辅音两大类。每个音素的发音具有区别于其它音素发音的独立特征,称为特征音。除部分辅音外,音素是以被泛音调制后的基频周期为循环周期的波动。由于泛音的调制作用,相邻波形极性对偶但半周期却不对称。
关键词:特征元群周期
中图分类号:H311 文献标识码:A 文章编号:1674-098X(2011)08(b)-0224-02
为了展示音素的循环结构,对于语音放大采用高增益放大器,放大器频带宽度设定在150Hz~2kHz。将语音中凡过零点的波动均被放大至脉冲状,没有过零点的波形被摒弃,经整形后送入计时器,记录每一个半波宽度(即半周期),并存入存储器。再播放时尽管有些失真,但仍然保持了原语音的基本特征。
记录半波半周期的计时器为16位宽。一个半周期数据必需用两个8位寄存器分别存储低字节和高字节。在文中标注时,采用双字节标注法有利于数值间的比较,其标注方法是:低字节数据在前,并有下划线;高字节数据在后,字体略大,与低字节数据之间不留空格,表示为一个完整的半周期数据;与前后相邻半周期数据画出高低电平以示区别。如表示1289这个半周期数据处于高电平,相邻半周期数据为低电平。计时器在运行时,每1微秒作一次加1操作,1289这个以双字节标注法表示的半周期数据转换成以秒为单位的10进制数为(9×256+128)×0.000001(s)=0.002432(s)。例1是单音素、阴平调“衣”的语音记录片段。
由于人的发声器官不可能对每个半波半周期都控制的非常精确,在允许一定误差的前提下,可以看出在例1中存在一个循環单元贯穿其中,由有下划线和不划线来区分(有无划线只是为了区分,没有本质区别);在这里称这个循环单元为特征元。在例1中所有特征元均为4位组成。相邻特征元的同一顺序号的位为对应位;如果对应位之间正负差值在几微秒~百微秒左右之间(个别现象除外)即认为是相同的。由于是循环结构,特征元的划分从任一位为起始位都是一样的;为了明显一致,特征元的划分以较低频率、高电平半波为起始位。
除部分辅音如X、SH、S等,是由声带送气、声源在嘴部发声以外,凡以声带发声为声源的音素都具有循环结构。如果出现特征元发生变异或消失必定是当前音素发音的结束。特征元内最少由一高一低两位半波组成,最多可达几十位。语音放大器带宽越宽位数就越多,反之减少。在相同条件下,不同特征音其特征元位数也可能不同;但是无论位数多少,必定由偶数位组成。
不同的特征音在特征元内有着不同的半波组成。例2是从不同的特征音中提取出来的特征元。通过比较可以看出它们之间的差别。
选择一个单音素、阴平调语音音素发音序列,将其划分出特征元,在保证特征元完整不变的前提下,把顺序打乱,以特征元为单位随机输入存储器,在播放时仍发原音。如果随机输入时每个特征元从尾部向前输入,也就是特征元反向输入,再播放时特征音仍不变。如果将所有特征元拆分开来,再随机输入,那么特征音便不复存在了。这说明特征元是保持音素特征音的最小单位。
特征元内各位半波半周期的总和称为群周期,以TN表示,对TN数值的表示方法仍采用双字节标注法。群周期由式1/TN﹝将双字节标注法转换为(秒)﹞=频率,进行群周期与基频频率的转换。
音素中特征元群周期不是一成不变的。在阴平调语音中会有小幅变化,在阳平、上声、去声的语音中,群周期随着声调的改变而改变,声调越高群周期越短。男声群周期长,女声群周期短。所以也可以同时认为音素是以特征元群周期为循环周期的。
例3中第一、二行是分别从校音管“A”和88键钢琴小字一组音名为“A”的发音序列中提取出的特征元。理论上它们的波动频率(440HZ)应该是相同的。再把二胡的外弦按校音管“A”校准,将其发音序列中提取出的特征元列于第三行。
在例3中,泛音按自身规律调制基频,于是就产生了独有的特征音(在音乐中叫音色)。同一基频被不同的泛音调制就会产生不同的音色。这就触类旁通的证明了语音中不同的特征音其特征元为什么会有不同的内部组成。
通过分析,可以得出:群周期与基频的波动周期是相同的。但是群周期与基频周期是两个不同的概念。群周期更加明确的揭示出音素的内在原理。
单音素字节的发音就是单音素本身的发音。由2~4个音素组成的字节中,人的发声器官对每个音素按即定顺序逐个发音(参照汉语拼音),人耳听觉系统听到的是这些音素的组合音。
在说话时,每个字节中音素的群周期,是随着地方方言发声规律、声调变化、再结合个人习惯、情感表达的不同而变化的。而在唱歌时,歌声中每个字节中音素群周期(除部分辅音外)必须与伴奏器乐对应音高的波动周期相同或呈倍频程(octave)关系,由于字节中音素的群周期依照音高按12平均律的规则变化,于是语音就有了乐感。
但是在歌声中音素群周期与音高对应不是跳变的。字节与字节之间的音高改变和一个字节在延长发声过程中的音高改变均不是跳变的。在两个不同音高的中间一小段过渡部分,群周期具有趋向性滑动改变:后音高高于前音高的群周期会递减直至达到目的音高;后音高低于前音高的则相反。
当声调变高时,群周期在循环过程中逐渐变短,特征元内各个半波的半周期有的位减值大,有的位减值小,也有的位保持相对稳定,这种变化并非变异,所以仍然保持着特征音。例4是从上声调“五”的语音序列中声调从低到高的一段提取出来的特征元进行比较。为了比较的方便,在例4中将特征元竖向排列,在实际语音中它们是首尾相连的。
在例4中每个特征元前面的数字为排队号,后面的TN值为群周期。第1号特征元内为6位,当运行到第7号时,第2位数据已减值到几乎为原值的一半,第3位数据也有减值。从第12号运行到第13号时,第1、2、3位数据已消失。第13号特征元的第1位数据是在这之前第1、2、3位数据的合并。特征元从第13号开始变为4位。从第13号到26号中的第1位继续不断减值,从第26号直到发生变异之前一直保持着这种组成。
如果将第13号以前特征元的第1、2、3位数据作人为合并(例4括号内数据),不会影响特征音,只是清晰度有所下降。所以可以将前3位看成是1个数据,这样一来所有的特征元都为4位。从中可以看出随着声调的升高,特征元内的第1位在不断减值,造成群周期的连续减小;但对所有特征元的后3位影响却相对较小。
在语音中存在很低频率的半波被分解现象,这是因为声带作很低频率振动时,由于半周期过长,在极限位置不能持久,便物极必反的向反方向运动(也应该属于泛音,如果将语音放大器频带放宽,会出现更多分解)。从波形上看就是被分解。随着声调变高群周期缩短,这种现象就会消失,形成合并。这就是例4中1~12号特征元的前3位数据半途合并的原因。合并后的这1位继续减值,当与其它同极性位的半周期数值接近时,语音就进入尾声了。
相邻特征元的群周期存在正负差值,而且特征元之间对应位也存在正负差值。语音中的差值激励人耳听力、增添了活跃气氛,但是这两种差值过大会造成语音噪声加大;如在语音启动阶段位与位之间差值较大(百微秒以上),噪声也大。随着差值的逐渐减小,语音变的清晰起来。如果完全消除差值,就会毫无生气,失去“生命迹象”,变成类似于共鸣的振动感。
不同的泛音结构对基频的调制会产生不同的特征音。泛音占据的是基频的份额,在满足了所有泛音的占据以后,在基频中只剩下相对泛音要低很多的低频半波了(有可能被分解)。群周期的变化首当其冲是相对低频半波的变化,每个泛音半波在变化中保持了相对稳定。这就是特征元的内涵。
在语音中任何一个有潜在能力可以影响語音性质的因素,如果仅在个别地方出现,其影响力微乎其微;它必需具有极高的重复概率和连续性才能发挥作用。
结论:
一.以声带发声为声源的音素中存在一个循环单元称之为特征元,特征元是语音中的基频被泛音调制以后的组合体,由偶数位组成,是保持音素特征音的最小单位。不同音素的特征元具有不同的内部组成。语音的传送以基频为载体,以泛音的调制为特征。
二.特征元内各个位半波半周期的总和称为群周期,语音声调由群周期决定。群周期与语音基频的波动周期是相同的。
三.歌声是具有循环结构的音素群周期按12平均律规则变化的語音。
关键词:特征元群周期
中图分类号:H311 文献标识码:A 文章编号:1674-098X(2011)08(b)-0224-02
为了展示音素的循环结构,对于语音放大采用高增益放大器,放大器频带宽度设定在150Hz~2kHz。将语音中凡过零点的波动均被放大至脉冲状,没有过零点的波形被摒弃,经整形后送入计时器,记录每一个半波宽度(即半周期),并存入存储器。再播放时尽管有些失真,但仍然保持了原语音的基本特征。
记录半波半周期的计时器为16位宽。一个半周期数据必需用两个8位寄存器分别存储低字节和高字节。在文中标注时,采用双字节标注法有利于数值间的比较,其标注方法是:低字节数据在前,并有下划线;高字节数据在后,字体略大,与低字节数据之间不留空格,表示为一个完整的半周期数据;与前后相邻半周期数据画出高低电平以示区别。如表示1289这个半周期数据处于高电平,相邻半周期数据为低电平。计时器在运行时,每1微秒作一次加1操作,1289这个以双字节标注法表示的半周期数据转换成以秒为单位的10进制数为(9×256+128)×0.000001(s)=0.002432(s)。例1是单音素、阴平调“衣”的语音记录片段。
由于人的发声器官不可能对每个半波半周期都控制的非常精确,在允许一定误差的前提下,可以看出在例1中存在一个循環单元贯穿其中,由有下划线和不划线来区分(有无划线只是为了区分,没有本质区别);在这里称这个循环单元为特征元。在例1中所有特征元均为4位组成。相邻特征元的同一顺序号的位为对应位;如果对应位之间正负差值在几微秒~百微秒左右之间(个别现象除外)即认为是相同的。由于是循环结构,特征元的划分从任一位为起始位都是一样的;为了明显一致,特征元的划分以较低频率、高电平半波为起始位。
除部分辅音如X、SH、S等,是由声带送气、声源在嘴部发声以外,凡以声带发声为声源的音素都具有循环结构。如果出现特征元发生变异或消失必定是当前音素发音的结束。特征元内最少由一高一低两位半波组成,最多可达几十位。语音放大器带宽越宽位数就越多,反之减少。在相同条件下,不同特征音其特征元位数也可能不同;但是无论位数多少,必定由偶数位组成。
不同的特征音在特征元内有着不同的半波组成。例2是从不同的特征音中提取出来的特征元。通过比较可以看出它们之间的差别。
选择一个单音素、阴平调语音音素发音序列,将其划分出特征元,在保证特征元完整不变的前提下,把顺序打乱,以特征元为单位随机输入存储器,在播放时仍发原音。如果随机输入时每个特征元从尾部向前输入,也就是特征元反向输入,再播放时特征音仍不变。如果将所有特征元拆分开来,再随机输入,那么特征音便不复存在了。这说明特征元是保持音素特征音的最小单位。
特征元内各位半波半周期的总和称为群周期,以TN表示,对TN数值的表示方法仍采用双字节标注法。群周期由式1/TN﹝将双字节标注法转换为(秒)﹞=频率,进行群周期与基频频率的转换。
音素中特征元群周期不是一成不变的。在阴平调语音中会有小幅变化,在阳平、上声、去声的语音中,群周期随着声调的改变而改变,声调越高群周期越短。男声群周期长,女声群周期短。所以也可以同时认为音素是以特征元群周期为循环周期的。
例3中第一、二行是分别从校音管“A”和88键钢琴小字一组音名为“A”的发音序列中提取出的特征元。理论上它们的波动频率(440HZ)应该是相同的。再把二胡的外弦按校音管“A”校准,将其发音序列中提取出的特征元列于第三行。
在例3中,泛音按自身规律调制基频,于是就产生了独有的特征音(在音乐中叫音色)。同一基频被不同的泛音调制就会产生不同的音色。这就触类旁通的证明了语音中不同的特征音其特征元为什么会有不同的内部组成。
通过分析,可以得出:群周期与基频的波动周期是相同的。但是群周期与基频周期是两个不同的概念。群周期更加明确的揭示出音素的内在原理。
单音素字节的发音就是单音素本身的发音。由2~4个音素组成的字节中,人的发声器官对每个音素按即定顺序逐个发音(参照汉语拼音),人耳听觉系统听到的是这些音素的组合音。
在说话时,每个字节中音素的群周期,是随着地方方言发声规律、声调变化、再结合个人习惯、情感表达的不同而变化的。而在唱歌时,歌声中每个字节中音素群周期(除部分辅音外)必须与伴奏器乐对应音高的波动周期相同或呈倍频程(octave)关系,由于字节中音素的群周期依照音高按12平均律的规则变化,于是语音就有了乐感。
但是在歌声中音素群周期与音高对应不是跳变的。字节与字节之间的音高改变和一个字节在延长发声过程中的音高改变均不是跳变的。在两个不同音高的中间一小段过渡部分,群周期具有趋向性滑动改变:后音高高于前音高的群周期会递减直至达到目的音高;后音高低于前音高的则相反。
当声调变高时,群周期在循环过程中逐渐变短,特征元内各个半波的半周期有的位减值大,有的位减值小,也有的位保持相对稳定,这种变化并非变异,所以仍然保持着特征音。例4是从上声调“五”的语音序列中声调从低到高的一段提取出来的特征元进行比较。为了比较的方便,在例4中将特征元竖向排列,在实际语音中它们是首尾相连的。
在例4中每个特征元前面的数字为排队号,后面的TN值为群周期。第1号特征元内为6位,当运行到第7号时,第2位数据已减值到几乎为原值的一半,第3位数据也有减值。从第12号运行到第13号时,第1、2、3位数据已消失。第13号特征元的第1位数据是在这之前第1、2、3位数据的合并。特征元从第13号开始变为4位。从第13号到26号中的第1位继续不断减值,从第26号直到发生变异之前一直保持着这种组成。
如果将第13号以前特征元的第1、2、3位数据作人为合并(例4括号内数据),不会影响特征音,只是清晰度有所下降。所以可以将前3位看成是1个数据,这样一来所有的特征元都为4位。从中可以看出随着声调的升高,特征元内的第1位在不断减值,造成群周期的连续减小;但对所有特征元的后3位影响却相对较小。
在语音中存在很低频率的半波被分解现象,这是因为声带作很低频率振动时,由于半周期过长,在极限位置不能持久,便物极必反的向反方向运动(也应该属于泛音,如果将语音放大器频带放宽,会出现更多分解)。从波形上看就是被分解。随着声调变高群周期缩短,这种现象就会消失,形成合并。这就是例4中1~12号特征元的前3位数据半途合并的原因。合并后的这1位继续减值,当与其它同极性位的半周期数值接近时,语音就进入尾声了。
相邻特征元的群周期存在正负差值,而且特征元之间对应位也存在正负差值。语音中的差值激励人耳听力、增添了活跃气氛,但是这两种差值过大会造成语音噪声加大;如在语音启动阶段位与位之间差值较大(百微秒以上),噪声也大。随着差值的逐渐减小,语音变的清晰起来。如果完全消除差值,就会毫无生气,失去“生命迹象”,变成类似于共鸣的振动感。
不同的泛音结构对基频的调制会产生不同的特征音。泛音占据的是基频的份额,在满足了所有泛音的占据以后,在基频中只剩下相对泛音要低很多的低频半波了(有可能被分解)。群周期的变化首当其冲是相对低频半波的变化,每个泛音半波在变化中保持了相对稳定。这就是特征元的内涵。
在语音中任何一个有潜在能力可以影响語音性质的因素,如果仅在个别地方出现,其影响力微乎其微;它必需具有极高的重复概率和连续性才能发挥作用。
结论:
一.以声带发声为声源的音素中存在一个循环单元称之为特征元,特征元是语音中的基频被泛音调制以后的组合体,由偶数位组成,是保持音素特征音的最小单位。不同音素的特征元具有不同的内部组成。语音的传送以基频为载体,以泛音的调制为特征。
二.特征元内各个位半波半周期的总和称为群周期,语音声调由群周期决定。群周期与语音基频的波动周期是相同的。
三.歌声是具有循环结构的音素群周期按12平均律规则变化的語音。