论文部分内容阅读
摘要:随着业务的发展,设备厂家提供的传统的流程与大量涌现的短语语音需求给信息业务工作构成沉重的工作负担,必须对传统的流程进行技术改进,以减轻急剧增加的短语语音所带来的繁重工作,从而提高工作效率。
关键词:电话信息;短语语音;流程技术改进
中图分类号:TN93 文献标识码:A文章编号:1007-9599 (2011)06-0000-01
Ideas and Strategies of Phrase Voice Broadcast Technology Reform for Information Platform
Luo Yongping
(Yunfu Branch of China Telecom,Yunfu527300,China)
Abstract:With business development,equipment manufacturers to provide the traditional processes and large numbers of phrase speech to the information needs of operations constitutes a heavy workload,the traditional process must be technological improvements to reduce the dramatic increase in voice brought the phrase Heavy workload,thereby improving efficiency.
Keywords:Telephone information;Phrase speech;Process technology improvements
一、基本情况
信息台目前仍使用建台之初的声讯业务平台设备,软硬件都是设备厂家新太公司的第一代产品版本。从九七年前后开始,我台就开始与市教育系统合作开通一年一度的中高考成绩和录取168声讯语音查询的节目,一年一度的中高考受到学生及其家长、家属的高度关注,本节目亦是及时获得中高考信息的重要途径,因此每年的节目开通时间,线路基本上达到饱和,业务收入非常乐观。根据设备要求,节目制作过程是在录取工作进行之前,要根据教育部门提供的各高校代码名称录制高校名称的语音文件,各高校对应专业录制对应高校的专业语音文件。在得到录取资料后,根据考生的录取高校代码及录取专业代码播报相应的高校名称和专业语音文件。
二、存在问题
(一)设备版本低。设备为九三年产品,是采用单一主流程控制同一接入码的所有节目,流程编译后受到流程大小的限制,流程过大,带来不能运行甚至死机等不稳定因素。中高考节目流程只占整个168平台流程的一部分,因此,流程应尽量简化,不能有过多的枝节。(二)高校名称专业语音编码复杂。高校名称的语音文件以相应学校的校代码作为语音文件名,每个学校的各专业名称的语音文件以相应学校代码加上两至三位的专业代码作为文件名。(三)语音录制工作量大。初期,高校数量不多,各高校专业数量有限,年度变化不大,语音录制工作量不大,但随着社会发展,录取高校名称急剧增加,对应专业名称更多不胜数,而且年度的变化增大,每年在高考录取之前,须制作的高校名称专业语音文件数量大增,并且从教育部门取得的《高校录取专业名册》到录取资料公布的时间很短,令录音人员不胜负荷。(四)流程结构繁杂,不适应形势的发展。社会在不断发展,录取高校的名称和专业名称势必不断增加,如此的业务流程必将带来节目制作的艰难程度,耗费大量的人力资源和硬盘空间,不适应形势的发展。
三、技改探索
随着高校数目的增多,以及高校代码的变化,2002年高考录取资料中,高校名称就达到3000个以上,平均每一高校50个专业以上,这样,按02年数量计算,需要录音制作的短语文件将达到153000个以上,这成为一项高考录取资料公布前一项艰巨的任务,02年以来,信息台对高考录取声讯查询的语音播报进行了技术改进,通过几年的实践,取得了较好的经济效益和社会效益,符合社会经济发展规律。
(一)技改措施。1.沿用原方法处理高考的录取查询工作,须要繁重的高校名称专业名称的录音工作,技术改造的目的,就是优化程序,免却大量短语语音的录制和繁杂的编码工作。明确了这个目标,需要对现用的古老的新太第一代声讯平台进行流程更新。在对设备的长期实践应用中,了解到新太平台是采用大型DAT数据库装载数据表,此数据表采用固定的10个字段格式,每一段的固定长度是15位,如下表:
因每一汉字占用两字节位,数据表中每一数据段15位最多可以存放7位汉字,而高校名称中基本上都是少于7位的校名和专业名,因而对考生的准考证号、姓名、录取学校和录取专业可分别放置于系统提供的固定格式的数据表中,数据表与文本文件可实现直接转换,因此,当我们收到不定期分批的高考录取资料时,可以很方便迅速地放入到数据表中给用查询。2.接下来的关键环节是当用户输入考生的准考证号,从数据表中检索到有考生的录取记录的时候,怎样把汉字转换成语音的问题。我们注意到,常用汉字有6000多个,一次性的把6000多个汉字录制成语音文件,不就有了所有汉字的语音了吗。再通过流程的控制,把每一个汉字形成一个语音文件读出,用户收到的每一个汉字的语音组合,就成了客户所需要的考生用户资料的语音版本。对汉字字段的处理方法是采用取右剩余位的方法。例如:对上表FD2的操作方法是:
SR3=FD2把FD2字段内容送到变量SR3
STRLENSR3求字段长度,置于IR0中
STRLEFTSR3,2取出字段左2位(一个汉字)形成语音文件名
STRRIGHTSR3,IR0-2截取剩余的右方长度减2位的字段
这样,重复后两步工作,直到字段中所有汉字都取出形成语音文件名为止,一个完整的学校名称就可以通过播放汉字文件名的语音文件获得。
(二)技改效益。1.经济效益。节约了大量的录音及编码处理工作,为高考录取信息的及时公布赢得了宝贵的时间。要录制上万条语音文件以及为这些文件正确编码,需每年花费一名录音人员及一名技术人员至少一个月的时间,如果不通过改造,高考自动声讯查询将难以实现。2.社会效益。通过技术改造,用户查询信息时,声讯系统可以报出考生的姓名,大大地提高了亲和力,为中国电信信息服务树立了良好的社会形象。增加了用户对电信信息服务的信任度。
四、技改成果的推广和应用
这种短语文本的语音转换技术推广开去,用于长文本的语音转换上,将免却了信息录音这一环节,大大节省了信息业务的投入,最简单地实现文本转语音技术,增加了电话语音业务的经济效益。
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文
关键词:电话信息;短语语音;流程技术改进
中图分类号:TN93 文献标识码:A文章编号:1007-9599 (2011)06-0000-01
Ideas and Strategies of Phrase Voice Broadcast Technology Reform for Information Platform
Luo Yongping
(Yunfu Branch of China Telecom,Yunfu527300,China)
Abstract:With business development,equipment manufacturers to provide the traditional processes and large numbers of phrase speech to the information needs of operations constitutes a heavy workload,the traditional process must be technological improvements to reduce the dramatic increase in voice brought the phrase Heavy workload,thereby improving efficiency.
Keywords:Telephone information;Phrase speech;Process technology improvements
一、基本情况
信息台目前仍使用建台之初的声讯业务平台设备,软硬件都是设备厂家新太公司的第一代产品版本。从九七年前后开始,我台就开始与市教育系统合作开通一年一度的中高考成绩和录取168声讯语音查询的节目,一年一度的中高考受到学生及其家长、家属的高度关注,本节目亦是及时获得中高考信息的重要途径,因此每年的节目开通时间,线路基本上达到饱和,业务收入非常乐观。根据设备要求,节目制作过程是在录取工作进行之前,要根据教育部门提供的各高校代码名称录制高校名称的语音文件,各高校对应专业录制对应高校的专业语音文件。在得到录取资料后,根据考生的录取高校代码及录取专业代码播报相应的高校名称和专业语音文件。
二、存在问题
(一)设备版本低。设备为九三年产品,是采用单一主流程控制同一接入码的所有节目,流程编译后受到流程大小的限制,流程过大,带来不能运行甚至死机等不稳定因素。中高考节目流程只占整个168平台流程的一部分,因此,流程应尽量简化,不能有过多的枝节。(二)高校名称专业语音编码复杂。高校名称的语音文件以相应学校的校代码作为语音文件名,每个学校的各专业名称的语音文件以相应学校代码加上两至三位的专业代码作为文件名。(三)语音录制工作量大。初期,高校数量不多,各高校专业数量有限,年度变化不大,语音录制工作量不大,但随着社会发展,录取高校名称急剧增加,对应专业名称更多不胜数,而且年度的变化增大,每年在高考录取之前,须制作的高校名称专业语音文件数量大增,并且从教育部门取得的《高校录取专业名册》到录取资料公布的时间很短,令录音人员不胜负荷。(四)流程结构繁杂,不适应形势的发展。社会在不断发展,录取高校的名称和专业名称势必不断增加,如此的业务流程必将带来节目制作的艰难程度,耗费大量的人力资源和硬盘空间,不适应形势的发展。
三、技改探索
随着高校数目的增多,以及高校代码的变化,2002年高考录取资料中,高校名称就达到3000个以上,平均每一高校50个专业以上,这样,按02年数量计算,需要录音制作的短语文件将达到153000个以上,这成为一项高考录取资料公布前一项艰巨的任务,02年以来,信息台对高考录取声讯查询的语音播报进行了技术改进,通过几年的实践,取得了较好的经济效益和社会效益,符合社会经济发展规律。
(一)技改措施。1.沿用原方法处理高考的录取查询工作,须要繁重的高校名称专业名称的录音工作,技术改造的目的,就是优化程序,免却大量短语语音的录制和繁杂的编码工作。明确了这个目标,需要对现用的古老的新太第一代声讯平台进行流程更新。在对设备的长期实践应用中,了解到新太平台是采用大型DAT数据库装载数据表,此数据表采用固定的10个字段格式,每一段的固定长度是15位,如下表:
因每一汉字占用两字节位,数据表中每一数据段15位最多可以存放7位汉字,而高校名称中基本上都是少于7位的校名和专业名,因而对考生的准考证号、姓名、录取学校和录取专业可分别放置于系统提供的固定格式的数据表中,数据表与文本文件可实现直接转换,因此,当我们收到不定期分批的高考录取资料时,可以很方便迅速地放入到数据表中给用查询。2.接下来的关键环节是当用户输入考生的准考证号,从数据表中检索到有考生的录取记录的时候,怎样把汉字转换成语音的问题。我们注意到,常用汉字有6000多个,一次性的把6000多个汉字录制成语音文件,不就有了所有汉字的语音了吗。再通过流程的控制,把每一个汉字形成一个语音文件读出,用户收到的每一个汉字的语音组合,就成了客户所需要的考生用户资料的语音版本。对汉字字段的处理方法是采用取右剩余位的方法。例如:对上表FD2的操作方法是:
SR3=FD2把FD2字段内容送到变量SR3
STRLENSR3求字段长度,置于IR0中
STRLEFTSR3,2取出字段左2位(一个汉字)形成语音文件名
STRRIGHTSR3,IR0-2截取剩余的右方长度减2位的字段
这样,重复后两步工作,直到字段中所有汉字都取出形成语音文件名为止,一个完整的学校名称就可以通过播放汉字文件名的语音文件获得。
(二)技改效益。1.经济效益。节约了大量的录音及编码处理工作,为高考录取信息的及时公布赢得了宝贵的时间。要录制上万条语音文件以及为这些文件正确编码,需每年花费一名录音人员及一名技术人员至少一个月的时间,如果不通过改造,高考自动声讯查询将难以实现。2.社会效益。通过技术改造,用户查询信息时,声讯系统可以报出考生的姓名,大大地提高了亲和力,为中国电信信息服务树立了良好的社会形象。增加了用户对电信信息服务的信任度。
四、技改成果的推广和应用
这种短语文本的语音转换技术推广开去,用于长文本的语音转换上,将免却了信息录音这一环节,大大节省了信息业务的投入,最简单地实现文本转语音技术,增加了电话语音业务的经济效益。
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文