论文部分内容阅读
北美地区用户拿到iPhone 4S真机的这几天,我的视野几乎被各种感慨Siri神奇功能的微博、视频刷了屏。如果你想看到更多的感叹号,不妨随便搜搜,不过我可不是来推销iPhone的果粉。
Siri这名字听起来跟语音指令一点关系都没有,Siri名字源于它由斯坦福为军方研发。于是在简单的惊呼神奇的段子刷屏结束之后,下一轮开始一篇篇技术长文用变形金刚片头的方式开始,一切从美国军方讲起,进而得出人工智能时代从此开始的划时代结论。
大多没错,它确实能用星际迷航的段子跟你对话,还能联想到各种民间流传的歌谣俗语,在你对它说“我爱你”的时候,它还会略带醋意地跟你扭捏一下,说道,“你可不能对别的手机这么说哦。”这简直就是技术宅的YY(意淫)必备、《生活大爆炸》的标准道具。
咱不仅得问,早就推出了语音搜索的google干嘛去啦?还得问,黑莓干嘛去了?诺基亚干嘛去啦?摩托罗拉干嘛去啦?先前推出的一众带有语言指令功能的智能/非智能手机制造商,我们都该问个遍。
把机器人性化,看起来很神奇吧?其实这点小伎俩一点都不新鲜。记得即时信息顶峰时期的MSN、QQ的聊天机器人——小i吗?高中时我还真是乐此不疲地跟它聊过几个回合,问它“爱不爱我”从来不会给出失望的答案,打趣得甚至比男朋友更好,只不过这打发无聊时间的聊天机器人后来沦为广告病毒的工具。
Siri就是语音识别 + 聊天机器人。让机器学会聊天一点都不难,数据库里存好各种关键词,用公式连接成句,回答总有固定句式,词汇、句型匹配再加上外联服务,齐活了。在这种情况下识别机器与人的分别只要多问几遍同样的问题就好,就算时过境迁,机器的回答永远都只是来回来去无聊的那几套。关键就在于,人能够识别情境,变换答案,机器的数据库却是死的。
那咱多收集用户信息随时更新数据库吧?就像追女生时呼之则来、有求必应总也没戏,你得投其所好并且新花样不断。这就是Siri在做的事情,时时更新需要一系列手机自备感应器,以及强大的网络支持,将用户的偏好信息反馈到软件后台中心来开发更好的回应——边用边学,这就显得聪明有趣多了。
聪明有趣的功能需要强大的自备 + 联网计算能力才能维持。这就是为什么iPhone 4刷不成iPhone 4S。一个S之差,远不止在于Siri从一个itunes store(苹果商城)里的第三方App变成了一个双击home键就可唤醒的功能,苹果其实把汤和药都给换了。
硬件上,更加强大的双核处理器和专门处理声音的模块,这样Siri运行起来就不会像iPhone 4的App版那么废电;软件上,App变功能意味着手机的各个其他功能都在后台与Siri直接连接了起来,并在理解指令之后,迅速、直接、少废电地做到执行指令。而不像android在发信息等简单任务外,只是能将语音转化为文字再依赖google强大的搜索功能。
总的来说,Siri吓唬菜鸟是够了,还有很多关键问题仍待解决:首先是噪音隔离问题。目前看来,你这私人助理还真是只能秘密情人般地跟你在二人世界里说悄悄话,什么时候能扶正这可是个严肃问题;其次,口音矫正问题,虽然咱都说着流利的英文,你非主流不是你的错,可Siri就看得上美音、英音、澳大利亚音;最后也是最重要的,苹果再一次悲催地不支持中文,但苹果已经信誓旦旦地要在明年推出中文Siri。
Siri这名字听起来跟语音指令一点关系都没有,Siri名字源于它由斯坦福为军方研发。于是在简单的惊呼神奇的段子刷屏结束之后,下一轮开始一篇篇技术长文用变形金刚片头的方式开始,一切从美国军方讲起,进而得出人工智能时代从此开始的划时代结论。
大多没错,它确实能用星际迷航的段子跟你对话,还能联想到各种民间流传的歌谣俗语,在你对它说“我爱你”的时候,它还会略带醋意地跟你扭捏一下,说道,“你可不能对别的手机这么说哦。”这简直就是技术宅的YY(意淫)必备、《生活大爆炸》的标准道具。
咱不仅得问,早就推出了语音搜索的google干嘛去啦?还得问,黑莓干嘛去了?诺基亚干嘛去啦?摩托罗拉干嘛去啦?先前推出的一众带有语言指令功能的智能/非智能手机制造商,我们都该问个遍。
把机器人性化,看起来很神奇吧?其实这点小伎俩一点都不新鲜。记得即时信息顶峰时期的MSN、QQ的聊天机器人——小i吗?高中时我还真是乐此不疲地跟它聊过几个回合,问它“爱不爱我”从来不会给出失望的答案,打趣得甚至比男朋友更好,只不过这打发无聊时间的聊天机器人后来沦为广告病毒的工具。
Siri就是语音识别 + 聊天机器人。让机器学会聊天一点都不难,数据库里存好各种关键词,用公式连接成句,回答总有固定句式,词汇、句型匹配再加上外联服务,齐活了。在这种情况下识别机器与人的分别只要多问几遍同样的问题就好,就算时过境迁,机器的回答永远都只是来回来去无聊的那几套。关键就在于,人能够识别情境,变换答案,机器的数据库却是死的。
那咱多收集用户信息随时更新数据库吧?就像追女生时呼之则来、有求必应总也没戏,你得投其所好并且新花样不断。这就是Siri在做的事情,时时更新需要一系列手机自备感应器,以及强大的网络支持,将用户的偏好信息反馈到软件后台中心来开发更好的回应——边用边学,这就显得聪明有趣多了。
聪明有趣的功能需要强大的自备 + 联网计算能力才能维持。这就是为什么iPhone 4刷不成iPhone 4S。一个S之差,远不止在于Siri从一个itunes store(苹果商城)里的第三方App变成了一个双击home键就可唤醒的功能,苹果其实把汤和药都给换了。
硬件上,更加强大的双核处理器和专门处理声音的模块,这样Siri运行起来就不会像iPhone 4的App版那么废电;软件上,App变功能意味着手机的各个其他功能都在后台与Siri直接连接了起来,并在理解指令之后,迅速、直接、少废电地做到执行指令。而不像android在发信息等简单任务外,只是能将语音转化为文字再依赖google强大的搜索功能。
总的来说,Siri吓唬菜鸟是够了,还有很多关键问题仍待解决:首先是噪音隔离问题。目前看来,你这私人助理还真是只能秘密情人般地跟你在二人世界里说悄悄话,什么时候能扶正这可是个严肃问题;其次,口音矫正问题,虽然咱都说着流利的英文,你非主流不是你的错,可Siri就看得上美音、英音、澳大利亚音;最后也是最重要的,苹果再一次悲催地不支持中文,但苹果已经信誓旦旦地要在明年推出中文Siri。