论文部分内容阅读
早在70年代,美国国家安全局就已经掌握了移动电话声音识别术,如果当时的苏联领导人勃列日涅夫乘车行驶在莫斯科的某条大街上,他用移动电话跟其他人说话,国家安全局的声音识别系统就会立即确认出勃列日涅夫的身份,他的谈话内容就会立即被国家安全局工作人员记录下来。五角大楼一位情报官曾表示:“这套系统甚至能够分辨出是车内的勃列日涅夫还是其他人打的嗝儿。
语音识别技术主要有声纹识别、内容识别、语种识别、语音标准识别等几方面。语音识别过程实际上是一种认识过程。就像人们听语音时,并不把语音和语言的语法结构、语义结构分开来,因为当语音发音模糊时人们可以用这些知识来指导对语言的理解过程,但是对机器来说,识别系统也要利用这些方面的知识,只是如何有效地描述这些语法和语义还有困难。
90年代初,美国电报电话公司想用计算机技术促进通讯业的发展,于是组织人马研究出一种语音识别软件。1992年3月,世界上第一套语音识别系统在美国诞生。当时这套系统的主要任务是代表公司向用户询问采用何种付款方式:诸如用信用卡还是现金等。
1997年,IBM推出了第一套中文语音识别系统,让我们看到人和机器用自然语言交流成为现实,为汉字输入带来了一股新鲜的潮流。1999年底,IBM中国公司在北京举行了1999IBM中文语音技术大会,首次发布了其普通话版本的电话语音识别技术,让我们看到了语音识别技术在电话系统中的广泛应用前景。近些年,很多领域都已经成为语音识别技术的应用热点,例如电话通信服务领域(如电话转接中心或查询中心)、金融领域(如家庭银行或股票信息查询)、旅游服务领域(如飞机订票或旅馆预订)等。
进入2000年以后,语音识别技术的发展更是突飞猛进。在IBM公司新近推出的世纪版语音识别系统中,我们看到用户不仅可以利用该系统口述文档、口述电子邮件、使用语言进行文档格式编排,还能直接口述“网上冲浪”这样的命令来访问网页,还可以实现真正的网上“聊天”。同时,由于这个版本的语音识别系统具备“文章智能分析功能”,可以主动学习用户的语言模型、风格,从而可以实现完全“只动口,不动手”操作计算机、网络以及其他电子设备的梦想。
语音识别中的声纹识别技术;在军事保密中有着重要的应用价值。据美国《华盛顿时报》披露,美国国家安全局一直将声音识别技术当作研究重点。比如,利比亚领导人卡扎菲就是美国情报机构重点识别的对象,现在,只要卡扎菲利用利比亚的通信网络进行通话。声音识别系统就会立即提醒工作人员:“卡扎菲正在通话,请注意。”最近,美国前情报官詹姆士·巴姆福德在其新著《秘密》一书中透露的一些内幕消息也证实了这套声音识别系统的存在。书中说,美国情报部门开始声音识别技术的研究已经有很多年了,最近几年,这套系统的功能不断完善,可以准确地识别出具体的声音。巴姆福德指出:“监听员甚至可以说出被监听者是否感冒了。”他还透露,国家安全局拥有大量被监听者的资料,有时候,监听员在监听时,旁边就放着这些被监听者的照片。据报道,曾迫降在我国海南机场的美军EP-3侦察机中就安装了声纹识别侦听模块。这一声纹识别系统功能强人,只要被侦察者通过无线电进行对话,该系统便能查明通话者的身份,尤其是高层领导者的身份。美军正是靠着这套功能强大的系统,掌握了其他国家大量绝密情报。五角大楼曾专门邀请语言学家,对被侦察国家的语言进行了全面深入的研究,开发出了一套独特的电子监听系统,只要美军截获到对方的通话,这套系统能立即识别出通话者的身份,从而判断出从中掌握到的情报的价值到底有多大。当截获到对方通话后,监听系统能自动删除杂音,通过与声音数据库相对照,准确识别出通话者身份。
另一方面,装备指纹识别系统,配合语音识别技术来查找国内隐藏的恐怖分子。目前,美国为每个美国人设计一张装在计算机芯片的监视识别卡,用于记录居民的情况。当有人使用这种卡时,就会在机场安检系统计算机里留下记录。这些卡片可以与指纹或者在今后几年的时间里与面部的特征协调起来,并被编成程序允许或禁止某人进入机场。在机场,使用驾驶舱门和行李箱搜索新技术,对机场休息室进行扫描,并对照数据库中可疑的恐怖分子检查旅客的外表形象。此外,使用一种专门照相机,可测出人体面部60~120种不同的变化,即使有人刮掉胡子或轻微整形登机,也难逃其锐利的“法眼”。再者,使用通过查验旅客的指纹和视网膜技术,以便能揪出恐怖分子。由于人的视网膜具有同指纹一样的特性,每个人的视网膜绝不相同,因而任何在册的可疑分子都无法逃过检查。采取护照加指纹措施,把流窜于世界各国的经常改名换姓的恐怖分子逮住。在接受检查时,护照与指纹同时证明持有者身份才有效。这样,即使罪犯改头换面也可辨认出真假。
在军事计算机系统和核心要害部位的封闭管理中,应用声纹识别技术进行身份认证,具有很高的精确度,可进一步增加系统的安全性。一些应用了声纹识别技术的新型计算机安全产品,可以在普通的USB加密钥匙基础上,增加声纹认证功能,并对计算机系统进行加密,保护计算机系统中的重要文件不被非法窃取、浏览、篡改、删除或破坏。在一些军事要地的核心部位,应用语音识别技术实施门禁管理,可以有效辨识合法进出者。保密管理系统根据输入的自然语音信号,进行声纹身份认证,并自动开启或闭合门禁设施。
应用声纹识别技术,可以对发出命令者进行身份确认,避免出现敌方利用我方信道伪装我指挥员发出假命令,干扰我方军事行动的情况。由于在计算机信息处理中,录音的过程要经过模拟到数字的信号转换,放音的过程还要经过数字到模拟的信号转换,因此,即使窃密者使用录音设备录下合法用户的声音进行声纹身份认证,经过从模拟到数字、再从数字到模拟的两次信号转换,声音频谱会有明显衰减和失真,这种失真很容易被认证程序分辩出来。所以,依靠录音登录也不能通过声纹认证。适当调节声纹认证严格程度的阈值,声纹认证的“错误接受率”和“错误拒绝率”可以有所下降。
语音识别技术主要有声纹识别、内容识别、语种识别、语音标准识别等几方面。语音识别过程实际上是一种认识过程。就像人们听语音时,并不把语音和语言的语法结构、语义结构分开来,因为当语音发音模糊时人们可以用这些知识来指导对语言的理解过程,但是对机器来说,识别系统也要利用这些方面的知识,只是如何有效地描述这些语法和语义还有困难。
90年代初,美国电报电话公司想用计算机技术促进通讯业的发展,于是组织人马研究出一种语音识别软件。1992年3月,世界上第一套语音识别系统在美国诞生。当时这套系统的主要任务是代表公司向用户询问采用何种付款方式:诸如用信用卡还是现金等。
1997年,IBM推出了第一套中文语音识别系统,让我们看到人和机器用自然语言交流成为现实,为汉字输入带来了一股新鲜的潮流。1999年底,IBM中国公司在北京举行了1999IBM中文语音技术大会,首次发布了其普通话版本的电话语音识别技术,让我们看到了语音识别技术在电话系统中的广泛应用前景。近些年,很多领域都已经成为语音识别技术的应用热点,例如电话通信服务领域(如电话转接中心或查询中心)、金融领域(如家庭银行或股票信息查询)、旅游服务领域(如飞机订票或旅馆预订)等。
进入2000年以后,语音识别技术的发展更是突飞猛进。在IBM公司新近推出的世纪版语音识别系统中,我们看到用户不仅可以利用该系统口述文档、口述电子邮件、使用语言进行文档格式编排,还能直接口述“网上冲浪”这样的命令来访问网页,还可以实现真正的网上“聊天”。同时,由于这个版本的语音识别系统具备“文章智能分析功能”,可以主动学习用户的语言模型、风格,从而可以实现完全“只动口,不动手”操作计算机、网络以及其他电子设备的梦想。
语音识别中的声纹识别技术;在军事保密中有着重要的应用价值。据美国《华盛顿时报》披露,美国国家安全局一直将声音识别技术当作研究重点。比如,利比亚领导人卡扎菲就是美国情报机构重点识别的对象,现在,只要卡扎菲利用利比亚的通信网络进行通话。声音识别系统就会立即提醒工作人员:“卡扎菲正在通话,请注意。”最近,美国前情报官詹姆士·巴姆福德在其新著《秘密》一书中透露的一些内幕消息也证实了这套声音识别系统的存在。书中说,美国情报部门开始声音识别技术的研究已经有很多年了,最近几年,这套系统的功能不断完善,可以准确地识别出具体的声音。巴姆福德指出:“监听员甚至可以说出被监听者是否感冒了。”他还透露,国家安全局拥有大量被监听者的资料,有时候,监听员在监听时,旁边就放着这些被监听者的照片。据报道,曾迫降在我国海南机场的美军EP-3侦察机中就安装了声纹识别侦听模块。这一声纹识别系统功能强人,只要被侦察者通过无线电进行对话,该系统便能查明通话者的身份,尤其是高层领导者的身份。美军正是靠着这套功能强大的系统,掌握了其他国家大量绝密情报。五角大楼曾专门邀请语言学家,对被侦察国家的语言进行了全面深入的研究,开发出了一套独特的电子监听系统,只要美军截获到对方的通话,这套系统能立即识别出通话者的身份,从而判断出从中掌握到的情报的价值到底有多大。当截获到对方通话后,监听系统能自动删除杂音,通过与声音数据库相对照,准确识别出通话者身份。
另一方面,装备指纹识别系统,配合语音识别技术来查找国内隐藏的恐怖分子。目前,美国为每个美国人设计一张装在计算机芯片的监视识别卡,用于记录居民的情况。当有人使用这种卡时,就会在机场安检系统计算机里留下记录。这些卡片可以与指纹或者在今后几年的时间里与面部的特征协调起来,并被编成程序允许或禁止某人进入机场。在机场,使用驾驶舱门和行李箱搜索新技术,对机场休息室进行扫描,并对照数据库中可疑的恐怖分子检查旅客的外表形象。此外,使用一种专门照相机,可测出人体面部60~120种不同的变化,即使有人刮掉胡子或轻微整形登机,也难逃其锐利的“法眼”。再者,使用通过查验旅客的指纹和视网膜技术,以便能揪出恐怖分子。由于人的视网膜具有同指纹一样的特性,每个人的视网膜绝不相同,因而任何在册的可疑分子都无法逃过检查。采取护照加指纹措施,把流窜于世界各国的经常改名换姓的恐怖分子逮住。在接受检查时,护照与指纹同时证明持有者身份才有效。这样,即使罪犯改头换面也可辨认出真假。
在军事计算机系统和核心要害部位的封闭管理中,应用声纹识别技术进行身份认证,具有很高的精确度,可进一步增加系统的安全性。一些应用了声纹识别技术的新型计算机安全产品,可以在普通的USB加密钥匙基础上,增加声纹认证功能,并对计算机系统进行加密,保护计算机系统中的重要文件不被非法窃取、浏览、篡改、删除或破坏。在一些军事要地的核心部位,应用语音识别技术实施门禁管理,可以有效辨识合法进出者。保密管理系统根据输入的自然语音信号,进行声纹身份认证,并自动开启或闭合门禁设施。
应用声纹识别技术,可以对发出命令者进行身份确认,避免出现敌方利用我方信道伪装我指挥员发出假命令,干扰我方军事行动的情况。由于在计算机信息处理中,录音的过程要经过模拟到数字的信号转换,放音的过程还要经过数字到模拟的信号转换,因此,即使窃密者使用录音设备录下合法用户的声音进行声纹身份认证,经过从模拟到数字、再从数字到模拟的两次信号转换,声音频谱会有明显衰减和失真,这种失真很容易被认证程序分辩出来。所以,依靠录音登录也不能通过声纹认证。适当调节声纹认证严格程度的阈值,声纹认证的“错误接受率”和“错误拒绝率”可以有所下降。