论文部分内容阅读
在讨论Siri遇到的问题时,我们首先要理解Siri究竟是什么。现在对它最大的误解可能就是,认为 Siri这类语音智能助手产品是由前端的语音识别、语义解析技术和后端的搜索组成的。事实上并不全是这样。
简单地说,智能助手产品是由三部分组成:前端的交互方式,也就是信息输入和输出的方式,比如语音是其中一种;中间的智能分析,相当于人的大脑;后面是数据库或者是获取方式,包括自有的数据库、第三方的数据库,以及搜索引擎等。
苹果的Siri目前是把语音作为前端的交互方式,这是和Nuance等合作来实现的。而苹果收购的Siri公司更核心的能力是在后端的智能分析上。
这确实是件很复杂的事,所以当最初投资 Siri项目之一的风险投资公司摩根塔勒合伙人Gary Morgenthaler说,“Siri的创始团队看到了未来、定义了未来并且顺利地迈开了通往未来技术的第一步,但被收购之后(苹果)Siri缓慢的商业化进程让我们这些创始团队感到非常失望”时,我不禁要问:这真的仅仅是个商业化的问题吗?
“对于人工智能来说,现在谈商业化还为时尚早,”小i机器人的创始人袁辉这样认为。他下这个判断是因为他在10年前就在人工智能领域做过了艰难的商业化尝试。
小i机器人是国内最早的智能机器人平台运营商,成立于2001年。据其官方发布的数据,2004年到2007年倚靠微软MSN平台,小i的用户超过1亿,交互量达到100亿次以上,覆盖100多个国家。2007年小i机器人获得了包括英特尔投资、IDG在内的5家风险投资机构的千万美元投资。但是大量的用户并没有给公司带来太多收入。
有用户没收入,袁辉在很长一段时间内一直把原因归结为“小i没找到好的盈利模式”。后来发现,用户的快速增长实际上掩盖了小i最根本的问题——究竟满足了用户的什么需求?
袁辉说,“小i当时的目标和如今的 Siri一样,希望做成一个无所不知、无所不能的变形金刚。但这几乎是很难实现的”。首先,语音识别不是完全靠算法能解决的,无论是Nuance还是科大讯飞都花了很多年去研发。而后边的智能分析和数据库密切相关,二者的匹配和系统构建是非常核心的,既包括开发互联网的信息还包括机器学习,这需要大量的整合和多年的积累。“时间是智能机器人最大的壁垒,而这不是靠开放平台、靠人多、钱多就能解决的,必须先知道要怎么做才行”。2009年,小i机器人全面转型到公司(B2B)业务上。
或许,这样一款产品,真的不能等在实验室里进行完各种微调和全面测试再推向市场,起码第一步它必须接触到从音质到自然语言解读的尽可能多的变化。
败给Google Now?谈胜负还早了点
但既然推向了市场,总免不了比较。Google推出语音数字助理Google Now,用户发现,暂且不提人工智能,仅从语音搜索来看,Google Now的准确率比Siri更高。于是,问题来了——谁能代表移动搜索的未来? 在这一点上,面对PC端搜索的老大,且Google有多年积累的知识图谱做后盾,确实让人为Siri捏一把汗。但移动搜索和PC搜索能一样吗?
“移动搜索有很强的场景性,不像桌面搜索是用关键词搜索大量资料,然后慢慢看。所以并不需要很深的知识图谱,反而对非结构化的、实时产生的数据有更大的需求。”智问创始人朱胜这样总结移动搜索的特征。
为了建立非结构化数据库,国内另一家语音助手类产品“虫洞语音助手”除了通过网络抓取、第三方合作,还开设了社区。虫洞的联合创始人郭家的总结是,“作为助手类的产品,长尾信息的组织是一大关键,它很难通过通用型搜索产品获得。”
显然,在非结构化数据上,苹果 Siri和Google Now都在以不同的方式发力。Siri与很多不同的服务集成在一起提供搜索结果,包括Yelp、OpenTable、Wolfram Alpha、Yahoo,以及Twitter和微软推出的搜索引擎Bing;Google Now也做出了重大革新,用户不再需要主动去搜索信息,谷歌会在适当的时候把信息提供给用户。这相当于搜索引擎在帮助人们做出决策。
从这一点来看,Google Now和Siri的目标都不仅仅囿于移动搜索,而是智能交互,搜索只是其中的一部分表现形式。最终,二者将殊途同归——整合数据库,提高智能分析能力,让机器主动学习理解人、服务人——只是他们依托各自现有的优势从不同角度在往前做。在这个目标下,目前二者都发展得比较初级,谈胜负还为时过早。
千万别把Siri仅仅当成一个语音助手
其实,Google Now也有难题,就是落地难。对于Google来说,谷歌的手机厂商和运营商总是很难及时向用户提供Android系统更新。而对于苹果这样一个软硬件结合的公司,并拥有封闭的生态系统,将Siri的能力落地并推向消费市场正是其优势所在。
“千万不要把Siri仅仅当成一个语音助手,它是苹果整个产品线包括操作系统演进的方向。”正如朱胜所说,苹果在逐渐把 Siri整合到iOS操作系统和硬件产品中去。2012年6月,苹果公司发布了iOS6,这一操作系统对汽车行业最大的意义在于将地图、车辆控制和 Siri语音功能相集合。苹果为Siri 打造的 Eyes Free驾车系统也已经日趋完善,目前已经有多家知名汽车厂商加入 Eyes Free阵营。
可见,苹果一定会充分发挥其硬件的优势。相信不久以后,Siri会横跨苹果整个产品线。以Siri和iCloud为依托打穿不同的设备间的连接,与App Store一起组成苹果的生态系统。
同时,苹果会发挥渠道和入口的作用。Siri将不仅仅是一款应用程序,它同时也是一款自然用户界面系统,占据用户与数字设备和互联网的第一触点,它使得服务器端可以整合大量开放API的数据。而这些数据是无法通过网络抓取的方式获得的。被整合进苹果操作系统中的Siri,可以方便被第三方调用。
对于苹果来说,最重要的是通过 Siri把人工智能带进了现实生活中。苹果更可能走的一条路径是,打造智能交互的底层架构,由它来提供人工智能助手通用层面的支持。在此之上,将产生更细分、垂直的智能化应用和服务,将人工智能助手渗透进生活的方方面面,而这将是中小创业者的机会所在。而基于Siri的智能大脑和数据库,智能服务前端的交互方式也会变得更加多样,除了声音,比如图像、视频、脑波等都可能成为信息采集和输出的方式。
简单地说,智能助手产品是由三部分组成:前端的交互方式,也就是信息输入和输出的方式,比如语音是其中一种;中间的智能分析,相当于人的大脑;后面是数据库或者是获取方式,包括自有的数据库、第三方的数据库,以及搜索引擎等。
苹果的Siri目前是把语音作为前端的交互方式,这是和Nuance等合作来实现的。而苹果收购的Siri公司更核心的能力是在后端的智能分析上。
这确实是件很复杂的事,所以当最初投资 Siri项目之一的风险投资公司摩根塔勒合伙人Gary Morgenthaler说,“Siri的创始团队看到了未来、定义了未来并且顺利地迈开了通往未来技术的第一步,但被收购之后(苹果)Siri缓慢的商业化进程让我们这些创始团队感到非常失望”时,我不禁要问:这真的仅仅是个商业化的问题吗?
“对于人工智能来说,现在谈商业化还为时尚早,”小i机器人的创始人袁辉这样认为。他下这个判断是因为他在10年前就在人工智能领域做过了艰难的商业化尝试。
小i机器人是国内最早的智能机器人平台运营商,成立于2001年。据其官方发布的数据,2004年到2007年倚靠微软MSN平台,小i的用户超过1亿,交互量达到100亿次以上,覆盖100多个国家。2007年小i机器人获得了包括英特尔投资、IDG在内的5家风险投资机构的千万美元投资。但是大量的用户并没有给公司带来太多收入。
有用户没收入,袁辉在很长一段时间内一直把原因归结为“小i没找到好的盈利模式”。后来发现,用户的快速增长实际上掩盖了小i最根本的问题——究竟满足了用户的什么需求?
袁辉说,“小i当时的目标和如今的 Siri一样,希望做成一个无所不知、无所不能的变形金刚。但这几乎是很难实现的”。首先,语音识别不是完全靠算法能解决的,无论是Nuance还是科大讯飞都花了很多年去研发。而后边的智能分析和数据库密切相关,二者的匹配和系统构建是非常核心的,既包括开发互联网的信息还包括机器学习,这需要大量的整合和多年的积累。“时间是智能机器人最大的壁垒,而这不是靠开放平台、靠人多、钱多就能解决的,必须先知道要怎么做才行”。2009年,小i机器人全面转型到公司(B2B)业务上。
或许,这样一款产品,真的不能等在实验室里进行完各种微调和全面测试再推向市场,起码第一步它必须接触到从音质到自然语言解读的尽可能多的变化。
败给Google Now?谈胜负还早了点
但既然推向了市场,总免不了比较。Google推出语音数字助理Google Now,用户发现,暂且不提人工智能,仅从语音搜索来看,Google Now的准确率比Siri更高。于是,问题来了——谁能代表移动搜索的未来? 在这一点上,面对PC端搜索的老大,且Google有多年积累的知识图谱做后盾,确实让人为Siri捏一把汗。但移动搜索和PC搜索能一样吗?
“移动搜索有很强的场景性,不像桌面搜索是用关键词搜索大量资料,然后慢慢看。所以并不需要很深的知识图谱,反而对非结构化的、实时产生的数据有更大的需求。”智问创始人朱胜这样总结移动搜索的特征。
为了建立非结构化数据库,国内另一家语音助手类产品“虫洞语音助手”除了通过网络抓取、第三方合作,还开设了社区。虫洞的联合创始人郭家的总结是,“作为助手类的产品,长尾信息的组织是一大关键,它很难通过通用型搜索产品获得。”
显然,在非结构化数据上,苹果 Siri和Google Now都在以不同的方式发力。Siri与很多不同的服务集成在一起提供搜索结果,包括Yelp、OpenTable、Wolfram Alpha、Yahoo,以及Twitter和微软推出的搜索引擎Bing;Google Now也做出了重大革新,用户不再需要主动去搜索信息,谷歌会在适当的时候把信息提供给用户。这相当于搜索引擎在帮助人们做出决策。
从这一点来看,Google Now和Siri的目标都不仅仅囿于移动搜索,而是智能交互,搜索只是其中的一部分表现形式。最终,二者将殊途同归——整合数据库,提高智能分析能力,让机器主动学习理解人、服务人——只是他们依托各自现有的优势从不同角度在往前做。在这个目标下,目前二者都发展得比较初级,谈胜负还为时过早。
千万别把Siri仅仅当成一个语音助手
其实,Google Now也有难题,就是落地难。对于Google来说,谷歌的手机厂商和运营商总是很难及时向用户提供Android系统更新。而对于苹果这样一个软硬件结合的公司,并拥有封闭的生态系统,将Siri的能力落地并推向消费市场正是其优势所在。
“千万不要把Siri仅仅当成一个语音助手,它是苹果整个产品线包括操作系统演进的方向。”正如朱胜所说,苹果在逐渐把 Siri整合到iOS操作系统和硬件产品中去。2012年6月,苹果公司发布了iOS6,这一操作系统对汽车行业最大的意义在于将地图、车辆控制和 Siri语音功能相集合。苹果为Siri 打造的 Eyes Free驾车系统也已经日趋完善,目前已经有多家知名汽车厂商加入 Eyes Free阵营。
可见,苹果一定会充分发挥其硬件的优势。相信不久以后,Siri会横跨苹果整个产品线。以Siri和iCloud为依托打穿不同的设备间的连接,与App Store一起组成苹果的生态系统。
同时,苹果会发挥渠道和入口的作用。Siri将不仅仅是一款应用程序,它同时也是一款自然用户界面系统,占据用户与数字设备和互联网的第一触点,它使得服务器端可以整合大量开放API的数据。而这些数据是无法通过网络抓取的方式获得的。被整合进苹果操作系统中的Siri,可以方便被第三方调用。
对于苹果来说,最重要的是通过 Siri把人工智能带进了现实生活中。苹果更可能走的一条路径是,打造智能交互的底层架构,由它来提供人工智能助手通用层面的支持。在此之上,将产生更细分、垂直的智能化应用和服务,将人工智能助手渗透进生活的方方面面,而这将是中小创业者的机会所在。而基于Siri的智能大脑和数据库,智能服务前端的交互方式也会变得更加多样,除了声音,比如图像、视频、脑波等都可能成为信息采集和输出的方式。