这不是未来,与电脑面对面交谈

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户:HUAXIAHK
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  《星球大战》中的机器人R2和主人之间的无间交流谁不羡慕?而如今,让电脑听懂人的话已经不是乔治·卢卡斯电影中的神奇景象。借助于TTS技术,小到让电脑朗读课文,大到人与机器人的智能交流都不在话下。那么什么是TTS呢?
  TTS是“Text To Speech”的缩写,即“从文本到语音”。它同时运用语言学和心理学的杰出之作,把文字智能地转化为自然语音流。电子小说软件将文字读出来、银行营业厅的语音叫号系统、词霸朗读单词、手机朗读短信和来电朋友的姓名……这就是目前应用最广泛的TTS语音识别技术。想了解其最新研究进展可以访问网站https://research.microsoft.com/speech/tts.asp。那么,我们又是如何进一步控制计算机的呢?
  
  计算机为什么能听懂我们的话?
  
  技术上,实现语音识别就是让计算机通过识别和理解的过程把自然语音信号转变为相应的文本或计算机指令。语
  音识别是一门交叉学科,所涉及的领域很广,包括信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
  在语音识别过程中,首先要将说话的声音由模拟的语音信号转换为数字信号,然后从信号中提取语音特征,同时进行数据压缩。输入的模拟语音信号也要进行预处理,包括预滤波、采样和量化、加窗、端点检测、预加重等。语音识别系统的模型通常由声学模型和语言模型两部分组成。
  


  p语音输入模式图
  


  p语音识别软件工作流程图
  语音识别过程主要分为两个阶段:“学习”阶段中,计算机的主要任务是建立识别基本单元的声学模型以及进行文法分析的语言模型,即构建参考模式库;在“识别”阶段,计算机根据识别系统的类型选择能够满足要求的识别方法,采用语音分析方法分析出这种识别方法所要求的语音特征参数,按照一定的准则和测度与参考模式库中的模型进行比较从而得出识别结果。
  
  Vista,语音识别就在你身边
  
  微软在最新推出的Vista中增加了上千个让人耳目一新的新功能,其中之一便是能让你与计算机进行交谈的“语音识别”技术。
  其实,Windows XP就已经内置了当时较为先进的TTS语音识别引擎,同时也支持语音输入功能,不过要实现语音输入功能还需要另外安装语音输入模块。
  而Windows Vista的语音识别功能已经内置在系统中,功能更为强大,我们可以通过说话来让计算机完成操作、输入文字、将屏幕上的文字朗读出来、处理文件夹和文件、通过IE浏览器来访问互联网、单击屏幕的任意位置、操作窗口和程序……这些功能基本上实现了通过语音命令来完成计算机的常用操作和语音输入命令,对于某些特殊需要的人来说非常实用。没有配置键盘、鼠标?记不清命令的路径?手忙不过来?一样可以通过说话控制计算机。
  


  pWindows Vista的语音识别向导
  


  p在Windows Vista控制面板中设置语音识别选项
  


  pWindows Vista的语音识别工具栏窗口
  


  p语音检索识别。可以通过哼唱歌曲的段落在卡拉OK厅找出想唱的歌曲,通过说话寻找手机电话本中的联系人,甚至可以用手机通过哼唱音乐旋律来下载彩铃。
  


  p使用语音控制通过说出不同链接的编号浏览网页
  如何找到并设置语音识别的功能呢?在Vista控制面板的搜索栏中输入“语音识别选项”即可。需要注意的是,在
  开始设置之前请将麦克风和音箱(或者耳机)连接到计算机上。如果启动语音识别时提示错误,可能是你开启了其他音频软件(比如Windows Media Player等音乐播放软件),关闭这些软件后就可以正常开启语音识别了。
  开启Windows Vista的语音识别软件后会出现一个语音识别设置向导,在其中会引导你对麦克风进行设置以及进行语音训练。语音训练是目前的语音识别软件比较通用的一个使用前的设置工作,因为我们每个人的说话口音和习惯都不同,计算机要听懂你说的话当然也需要提前学习,大大提高语音识别的准确率。
  语音识别设置向导不仅能帮助计算机学习和适应你的说话习惯,还能教给你语音识别的使用方法和常用的语音命令。设置完成并启用语音识别功能以后,Windows的语音识别提示工具窗口会浮现在桌面上方以方便你随时使用。这时,我们就可以随心所欲地通过与计算机“交谈”来控制计算机了。特别值得一提的是,Vista的语音识别对于桌面控制和在使用浏览器浏览网页上也更加人性化,比如它会自动检测并给网页链接加上编号,读出编号即能访问相应的链接了。
  


  p语音翻译识别。一些智能手机上提供的翻译功能,你说出中文,它将中文翻译成英文朗读出来,方便和外国人之间进行交流。
  
  使用高精度的语音识别还可以进行快速的会议记录,甚至实现听懂多种不同语言并同步进行翻译,你家的电灯、冰箱和微波炉也将能听懂你的话并且与你进行交谈。语音识别技术目前是一项快速发展的技术,在工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域,语音识别技术的发明和应用正在逐步让梦想成为现实。相信在不远的将来人与计算机之间可以面对面地对话,甚至分辨不出对方是否是计算机。
其他文献
西瓜枯萎病又称死秧病,在老瓜区和西瓜集中产区发病最重。发病后,轻者减产20%~40%,重者则减产60%~80%,有的地块甚至绝产。该病除危害西瓜外,还危害黄瓜、冬瓜、甜瓜等葫芦科作物。
近几年来,越来越多的人开始加入到户外探险的行列中来,但是由于缺乏户外探险知识和必要的装备保护,野外遇险的事件层出不穷。10月26日。七名登山者在河北蔚县小五台山失踪,引起了各方的关注并迅速展开救援行动。  在几次救援无果的情况下,相关方面联系到山岳救援队,请求他们予以援助。接到通知后。山岳救援队连夜出发到达现场。通过详细了解情况和缜密细致的分析,他们判断遇险人员所处的位置可能位于素有“小五台山百慕
  通过对卷心菜各层细菌、霉菌、酵母菌、乳酸菌总数的检测,并首次采用基因组DNA提取、16SrRNA序列的PCR扩增、PCR产物直接测序及序列对比分析等手段研究卷心菜微生物菌相特
  目的 建立基于新型Taqman荧光探针的荧光实时(Real-time)PCR方法用于空肠弯曲菌的筛选检测与快速鉴定。空肠弯曲菌(Campylobacter jejum)是近十几年来在世界范围内广泛重
会议
记者近日从自治区文化厅了解到,通过普查发现,自我区非物质文化遗产保护工程实施以来,目前全区共有非物质文化遗产406项.
  为建立快速准确的副溶血性弧菌的检测体系。本文根据滚环扩增方法的原理设计引物、锁式探针以及反应体系。试验证明了RCA检测体系具有很好的特异性、灵敏度和稳定性,适用
  从烟台近郊土壤中分离出一株单核缅胞增生李斯特菌拮抗微生物sly-3,利用传统分类学和分子生物学相结合的方法对其进行鉴定,并采用生物测定的方法评价其抑菌活性。菌株的形
会议
  建立了一种采用电化学阻抗免疫生物传感器快速检测沙门氏菌的方法。利用金纳米颗粒(NAuPs)、碳纳米管(CNT)、聚酰胺-胺(PAMAM)和壳聚糖(Chi)制备的复合材料修饰玻碳电极,
会议
  从进口水产品中分离到的菌株F5-11,通过VITEK 2 compact全自动微生物鉴定仪的分析,初步鉴定为副溶血弧菌(Vibrio parahaemolyticus)。根据副溶血弧菌的毒力基因(tlh和toxR)
  目的 用脉冲场凝胶电泳(PFGE)分子分型方法,分析辽宁丹东和广东珠海两地区从水体和水产品中分离的霍乱弧菌之间的相关性。方法 对39株霍乱弧菌用内切酶Notl酶切DNA后进行P
会议