基于TTS和Lrc歌词编辑器制作英语听力材料的实践*

来源 :中国教育信息化·基础教育 | 被引量 : 0次 | 上传用户:robert610
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:文章介绍了基于TTS和Lrc歌词编辑器制作英语听力材料的基本过程,具体介绍了NeoSpeech的TTS语音引擎、TTS软件Verbose和Lrc歌词编辑器的使用,并说明了合成的英语听力材料的使用方式。对该资源制作方法的应用效果的调查研究表明,这种方法具有简单易学、内容制作灵活、快速生成资源、材料使用方便和支持移动学习的优势,但生成的语音在韵律处理-合成音质上仍有一定的不足和限制。
  关键词:TTS; Lrc;听力材料;英语教学;资源制作
  中图分类号:TP319 文献标志码:A 文章编号:1673-8454(2014)04-0072-03
  一、引言
  听力学习是英语教学的基础和重点内容,英语听力教学材料的开发和听力教学资源库的建设也成为各级学校英语数字化教学资源建设的一项重要工作。目前语音合成技术在语言教育领域中最典型的应用就是TTS技术(Text-to-Speech)。TTS技术又称文语转换技术,可将计算机中的文字智能地转化为自然语音流。[1]Lrc歌词编辑器可以用来制作在播放语音文件时显示听力文本材料的字幕。相关研究表明,视听结合的听力练习有助于提升教学的效率,有利于学生对学习内容的理解、接受和模仿。[2]本研究将阐述基于TTS和Lrc歌词编辑器制作视听结合的英语听力材料的过程和方法。
  二、使用TTS软件合成英语语音文件
  1.安装第三方语音引擎
  (1)目前主流的英文语音引擎
  目前,市场上研发语音引擎的企业有很多,其中主流的产品包括Nuance 公司的VoiceBroker、科大迅飞公司的ViviVoice和InterPhonic TTS、IBM 公司的ViaVoice TTS、微软公司的Microsoft Speech SDK[3]和NeoSpeech的TTS等,它们均提供语音应用设计接口(SAPI)用于二次开发。
  (2)安装NeoSpeech语音引擎
  NeoSpeech的TTS是当前业界发声效果最好,非常接近自然语言的文字语音转换引擎,它提供了包括Kate、Julie、Paul等真人发声语音库,目前国内的金山词霸、Babylon等软件、英语网站和许多电子词典都使用NeoSpeech的引擎。我们可以购买NeoSpeech的正式授权版本或在网上下载语音引擎的试用版并安装。[4]
  2.使用TTS软件Verbose生成语音文件
  (1)Verbose简介
  Verbose Text to Speech是NCH Software公司的一款文本朗读工具,其主要功能是朗读文本内容,并将其朗读声音保存为MP3或WAV文件。[5] 其主要特点有:支持读取多种格式的文本,包括.txt、.doc、.pdf、.rtf和html等格式;可灵活地使用系统自带或第三方的语音引擎;支持改变语音特征,包括改变和设置速度、音调和音量;支持设置目标文件的MP3和WAV的编码选项;提供了一系列语音录制和编辑、多音轨混编等配套软件。
  (2)使用Verbose合成语音的步骤
  ①安装软件和设置语音引擎。在NCH Software的官方网站上下载Verbose Text to Speech,并完成软件的安装。启动软件,在软件主界面的“ChooseVoice”下拉菜单中会出现系统已安装的语音引擎列表。例如,在本案例中选择了女声引擎“VW Julie”。
  ②导入听力材料文本文件。Verbose支持包括从文件、系统粘贴板、当前打开的Word或pdf文档中导入语音文本。使用最简单的复制和粘贴动作就可以把听力材料的文本导入系统,导入文本后在主界面的文本区会看到相应的英语语句。
  ③调节语速、音调和音量参数。在软件界面中点击“Read”按钮可以试听声音的效果。如需要调节语速、音调和音量,点击“Voice Option”按钮,在弹出的对话框中选择所需的语音引擎,再勾选“Globally alter voice recitation”(改变语音朗读全局效果)选项,再分别调整Speed(音调)、Pitch(音调)和Volume(音量),操作如图1所示。通过参数的调整可以让声音听起来更加接近自然朗读效果,并符合听力材料所需的难度和需要。
  ④设定合成语音编码参数和格式,保存语音文件。Verbose允许生成MP3和WAV格式的语音文件,还可以调整文件的语音编码参数。在主界面中单击“Option”按钮,在弹出对话框的“General”选项卡下找到“Save Speech Setting”,将保存格式设为“MP3”,点击“Format Setting”按钮,则可以进一步设置编码比率和信道编码模式。单击“Save Speech”按钮,选择保存格式和文件名称后就可以保存当前的声音,例如可将当前声音保存为“Speech.MP3”。
  三、使用Lrc歌词编辑器制作字幕文件
  1.LRC歌词与Lrc歌词编辑器
  LRC歌词是一种包含着“[*:*]”形式的“标签(tag)”的、基于纯文本的歌词专用格式,用于歌词的同步显示。可以使用专用的歌词编辑软件或普通的文本处理软件来查看和编辑LRC歌词。在LRC歌词文件中,用时间标签来标记歌词出现的时间,时间标签的基本形式为“[mm:ss]”或“[mm:ss.fff]”(分钟数:秒数)。根据这些时间标签,客户端程序会按顺序依次高亮显示歌词,从而实现歌词文件与声音同步显示。[6]
  Lrc歌词编辑器是速配歌词独立自主开发的Lrc歌词编辑器,由蒋南编写,可在Winamp播放器与自带播放器配合的条件下制作歌词;Lrc歌词编辑器支持LRC、TXT、SRT等多种歌词转换,以及批量歌词转换。[7]以下以Lrc歌词编辑器为例说明英文听力材料的歌词的制作。   2.使用Lrc歌词编辑器制作听力歌词文件
  (1)下载并安装Lrc歌词编辑器软件
  在速配歌词的网站的软件下载栏目,可以免费下载并安装最新版本的Lrc歌词编辑器软件。[7]
  (2)启动编辑软件,载入字幕文本
  在启动了Lrc歌词编辑器软件后,用复制粘贴的方法将文本贴入到歌词编辑工作区当中,或在工具栏的“文件”菜单中运行“打开歌词文件”,载入已有的LRC文件。通常最近复制进来的整段的英文文本显示为一行,因此要先分割文本。在英文文本中有逗号或句号的句子的中间用“Enter”键进行换行,如有长句则要考虑使之单行的长度适中。
  (3)同步精听语音,插入时间标签
  启动Lrc歌词编辑器时,系统会默认同时启动MP3播放软件Winamp,将前面制作的“Speech.MP3”拉入到Winamp的播放列表。在Lrc歌词编辑器中点击“播放”按钮可以开始播放该文件,在听到一行英文即将开始时点击“暂停”按钮,将光标移动到这行歌词的开始位置,再点击“插入标签”,即可在对应位置插入时间标签。具体操作如图2所示。
  (4)编辑项目信息,保存歌词文件
  在Lrc歌词编辑器软件的下方录入歌词的项目信息,点击“保存”按钮,按提示即可保存该歌词文件,一般将歌词文件设为与音频文件相同的名称。例如,将当前歌词文件保存为“Speech.lrc”。为了避免iPad中处理歌词文件的麻烦,还可以在工具栏的“嵌入歌词”菜单中运行“嵌入歌词到MP3/WMA音频文件中”,再选择对应的单频文件,即可将当前歌词嵌入到MP3或WMA文件中。
  四、英语听力材料的使用方式
  一般情况下,需要将MP3或WMA格式的音频文件和lrc格式的歌词文件以相同的名称来命名,并放在同一文件夹下,这样播放软件或工具会自动建立两者的关联。
  1.在PC环境下使用
  在PC环境下,使用千千静听、酷狗播放器等支持歌词显示的多媒体播放软件,即可方便地使用英语听力材料。
  2.在智能手机环境下使用
  随着信息技术的快速发展,智能手机和移动终端的普及,越来越多的学习者以基于移动学习的方式练习听力。在Android和Windows Phone操作系统的手机中,可使用USB模式或第三方管理软件将音频文件或歌词文件存入智能手机的存储器中,使用酷狗播放器就可以在练习听力时切换到歌词查看模式,还可以在触控屏上将播放控制线移动到歌词对应位置,即可根据听力内容快速切换语音。
  五、应用效果
  为了验证基于TTS和Lrc歌词编辑器制作英语听力材料这种资源制作方法的应用效果,笔者所在的课程团队于2012年10月在广东某外语学院外语系和学前教育系的《多媒体课件制作》课程中教授相关内容,并开展调查研究,结果表明这种方法优势明显,但也有一定的不足和限制。
  1.技术优势
  (1)方法简单易学,具有可推广性
  由于仅需掌握Verbose和Lrc歌词编辑器这两个软件的使用就可以完成英语听力材料的制作,有85.3%的学员在两个课时内就能掌握这种方法的使用,93%的学员认为此方法简单易学,有推广性。
  (2)内容制作灵活,快速生成资源
  由于语音合成的音频文件可以根据文本内容更改,这样就可以根据用户的个人需要快速生成相关资源,具有高度的灵活性和实用性,为建设听力素材或其他语音教学资源提供了简便的技术手段。
  (3)材料使用方便,支持移动学习
  由于相关的听力材料可以在智能手机或MP3播放器中使用,方便用户利用碎片化的时间开展学习,有82%的学员表示喜欢这种听力练习方式。
  2.不足与限制
  由于韵律处理-合成音质(Quality of Synthetic Speech)是语音合成技术中的重大难点,不同的受众对TTS技术生成的语音的清晰度、自然度和连贯性等方面存在不同的主观评价。尽管使用了目前业界质量相对较高的NeoSpeech TTS语音引擎,仍有一些学员表示与自然语音相比,合成的语音在情感表达、声音的停顿控制上有待改进,长时间听会有一定的疲劳感。此外,合成的音频在播放过程有明显且连贯的气息切换声音,对音色有一定影响。
  六、结束语
  随着语音合成技术的不断发展,合成语音与自然语音的区别和差异将会不断缩小,而TTS、LRC等制作技术的应用,使得快速生成听力教学材料成为可能,在当前的信息技术环境下让教学和学习变得更加方便和快捷。
  参考文献:
  [1] TTS技术[EB/OL].http://baike.baidu.com/view/549184.htm.
  [2]张法科,赵婷.基于英语视听学习网站的大学英语听力教学模式设计[J].外语电化教学,2007(2):36,40.
  [3]童强, 洪家平等.一种基于TTS的语音朗读技术及其教育应用[J].中国电化教育,2007(3):108-110.
  [4]NeoSpeech[EB/OL].http://www.neospeech.com/.
  [5]NCH Software[EB/OL].http://www.nchsoftware.com/.
  [6]LRC歌词[EB/OL].http://baike.baidu.com/view/239396.htm.
  [7]Lrc歌词编辑器[EB/OL].http://www.99lrc.com/.
  [8]沙国泉.英语朗读软件(TTS)实用性的实验与分析[J].外语电化教学,2004(6):51-54.
  (编辑:鲁利瑞)
其他文献
摘 要:探究学习是新课程所倡导的学习方式,但探究学习在实际应用中存在着“被探究”的现象,而且探究学习的效果也经常受到质疑。如何让探究学习变得真实有效起来呢?作者结合教学实践,从探究内容的选择、探究情境的创设、探究资料的选择整理、探究任务的设计、探究活动中交流的安排、探究成果的检验这六个方面进行阐述,力求与同行探讨,使得探究学习能更真实更有效。  关键词:探究学习;教学实践;高中;信息技术  中图分
摘 要:随着IT行业的迅猛发展,社会对计算机网络人才的需求已经由单一的技术型人才为主转向面向技术与面向业务和素质相结合的复合型人才。为了使培养的人才符合社会需求,我们以计算机网络类专业为例,开展了“四段一体”实践教学体系建设。本文从实践课程体系改革、实践教学模式改革和实践教学平台的构建等方面进行了具体阐述,并介绍了建设的成果。  关键词:实践教学体系;四段一体;虚拟现实  中图分类号:G712 文
摘 要:本文将当前与高校教学整合的信息技术分为计算机辅助教学技术、网络教学平台技术和智能教育平台技术三类,从技术、使用、效果三个方面对三类技术存在的弊端进行了探讨,最后得出结论:信息技术与高校教学整合的实质不是使用好信息技术,而是扬信息技术之长来创建“教师主导—学生主体相结合”的教学结构,并以此结论为指导,尝试在教学实践中使用“报告式主题学习”的教学模式。  关键词:信息技术与教学整合;计算机辅助
摘 要:作者在《软件测试技术》课程的PBL教学方法改革实践过程中,设计了一种新颖的曲线式调查问卷,旨在获得学生对该课程全过程的教学效果评价。通过所设计的调查问卷数字化程序以及图形展示与数据分析脚本,构建了一个信息化的教学效果评价方法。通过应用该评价方法分析本课程的教学效果,得到了进一步深化教学改革的有效措施。另外,该方法还可方便地应用到其他课程,是一种值得推广的信息化教改方法。  关键词:调查问卷
摘 要:长沙民政职业技术学院依托职教新干线空间教学平台,在各专业中推出ISAS①教学实践,通过大胆地创新应用,将ISAS的学习成果、老师与学生的互动、过程监控和管理等环节都得以完整地在空间记录下来。在此基础上,湖南省教科院职业教育博士后工作站将这一教学组织在职业教育专题讨论班展开讨论,形成了基于空间和ISAS的S-ISAL教学法。作者在软件开发与项目管理专业的教学中对这一教学法做了深入的实践与探讨