论文部分内容阅读
在数字时代,我们可以闭着眼睛,在车上享受一段小说的有声朗读;也能在陌生的城市里,让语音导航系统轻松带路。随着MP3、手机、阅读器或iPad的普及使用,轻巧的移动电子产品将逐渐取代厚重的书籍。
语音效果超越机器人声
未来应用广泛的语音介面,将与过去我们熟悉的有声书概念不同,因为这些播音的内容并不是通过耗时费力的真人录音,而是仰赖最新发展的TTS(Text To Speeh文字转语音合成)技术,自动将文章内容转换成合成语音。
这项国际上早已投入发展的技术,在台湾由“工研院”领先研发,近10多年历经了三代的技术变革。5月底宣布上市的电子书阅读器“远流金庸机”,便是使用了最新一代的TTS技术。读者不仅能读,也可以听。对视力不好,或在运动中不便阅读屏幕的读者来说,TTS都是非常方便的功能。
大师霍金靠TTS发声
这项技术虽名为合成音,但并非不自然的机器音。“工研院”郭志忠副主任表示,他们仍需找配音员录音,来产生合成需要的声音与音韵的统计模型和参数,因此,语音效果早就超越那种声调僵硬的机器人声音。研发过程中,最重要也是最困难的部分,就是必须结合分析音韵与词语结构的语言学知识、建构音韵特性模型的统计方法,以及合成语音波形的信号处理技术,让最后合成的阅读声音,不仅可以做出自然流畅的语音,还可自动判别日期、金额等特殊数字或破音字的读法等等。
TTS能够将电子档的文字自动转成语音,对视障者来说是重要且必要的功能。过去“工研院”曾与爱盲文教基金会合作,建构有声书下载的公益平台。除了视障者之外,车上的导航系统,及老人、儿童、语言学习者也都是TTS技术服务的广大对象。其中最特别也最著名的例子是全身麻痹的美国物理学大师霍金,就是通过TTS技术将想表达的文字即时转成语音发声,与人沟通。
郭志忠认为,过去真人录音的有声书因制作成本高,价格贵,普及率较低。进入电子书时代后,文字都已经数字化了,TTS技术将更有机会搭配电子书而普及。亚马逊于2009年2月发表Kindle2时,主要的新增特色就是TTS语音朗读功能,可见这是电子书阅读器发展的趋势。
最大瓶颈在于授权
因为同时预见了这个趋势,“工研院”与远流金庸机的合作才一拍即合。但郭志忠坦言,目前电子书发展最大的瓶颈在于版权的授权与管控问题。即便是将电子书通过合成有声播放,大部分出版社仍主张有声书另有版权,如Kindle2朗读功能推出后,即被出版社控告侵犯版权、触犯重制罪,最后Kindle只好退让,仅提供愿意授权开放的书籍使用这项功能。
不过,除了电子书外,TTS还可应用在各种移动装置,能够取代电脑的多媒体影音装置,iPad就是一个标志。郭志忠乐观地说,未来我们不再是坐在桌前、打开电脑才能上网与阅读,我们可以在路上听路况、在厨房里听食谱、在参观博物馆时即时听导览。到那时,可以让人在移动中使用的语音介面变得不可或缺,TTS的角色也将更加重要。
语音效果超越机器人声
未来应用广泛的语音介面,将与过去我们熟悉的有声书概念不同,因为这些播音的内容并不是通过耗时费力的真人录音,而是仰赖最新发展的TTS(Text To Speeh文字转语音合成)技术,自动将文章内容转换成合成语音。
这项国际上早已投入发展的技术,在台湾由“工研院”领先研发,近10多年历经了三代的技术变革。5月底宣布上市的电子书阅读器“远流金庸机”,便是使用了最新一代的TTS技术。读者不仅能读,也可以听。对视力不好,或在运动中不便阅读屏幕的读者来说,TTS都是非常方便的功能。
大师霍金靠TTS发声
这项技术虽名为合成音,但并非不自然的机器音。“工研院”郭志忠副主任表示,他们仍需找配音员录音,来产生合成需要的声音与音韵的统计模型和参数,因此,语音效果早就超越那种声调僵硬的机器人声音。研发过程中,最重要也是最困难的部分,就是必须结合分析音韵与词语结构的语言学知识、建构音韵特性模型的统计方法,以及合成语音波形的信号处理技术,让最后合成的阅读声音,不仅可以做出自然流畅的语音,还可自动判别日期、金额等特殊数字或破音字的读法等等。
TTS能够将电子档的文字自动转成语音,对视障者来说是重要且必要的功能。过去“工研院”曾与爱盲文教基金会合作,建构有声书下载的公益平台。除了视障者之外,车上的导航系统,及老人、儿童、语言学习者也都是TTS技术服务的广大对象。其中最特别也最著名的例子是全身麻痹的美国物理学大师霍金,就是通过TTS技术将想表达的文字即时转成语音发声,与人沟通。
郭志忠认为,过去真人录音的有声书因制作成本高,价格贵,普及率较低。进入电子书时代后,文字都已经数字化了,TTS技术将更有机会搭配电子书而普及。亚马逊于2009年2月发表Kindle2时,主要的新增特色就是TTS语音朗读功能,可见这是电子书阅读器发展的趋势。
最大瓶颈在于授权
因为同时预见了这个趋势,“工研院”与远流金庸机的合作才一拍即合。但郭志忠坦言,目前电子书发展最大的瓶颈在于版权的授权与管控问题。即便是将电子书通过合成有声播放,大部分出版社仍主张有声书另有版权,如Kindle2朗读功能推出后,即被出版社控告侵犯版权、触犯重制罪,最后Kindle只好退让,仅提供愿意授权开放的书籍使用这项功能。
不过,除了电子书外,TTS还可应用在各种移动装置,能够取代电脑的多媒体影音装置,iPad就是一个标志。郭志忠乐观地说,未来我们不再是坐在桌前、打开电脑才能上网与阅读,我们可以在路上听路况、在厨房里听食谱、在参观博物馆时即时听导览。到那时,可以让人在移动中使用的语音介面变得不可或缺,TTS的角色也将更加重要。