论文部分内容阅读
谁都没想到,智能音箱会在今年成为热点。
在2014年11月,亚马逊就低调发布智能音箱 Echo。当时它给整个业界带来的印象,只是一款创新的硬件产品,可通过语音交互播放音乐,播报天气,闹钟提醒等,做一些简单的服务输出。在一向紧盯美国科技界创新发展的中国,鲜有追随者。但到了2016年11月,Echo在美国的销量已经达到了3 510万台。
到2016年,根据市场调研机构Strategy Analytics 的数据,2016年智能音箱全球出货量为590万台,并将在2022年增长10倍,市场规模将达到55亿美元。
风口似乎出现了。
2017年,微软的Invoke和苹果的Home pod发布之后,数得上的巨头已悉数入局,这在中国引发了一场跟风潮。天猫、联想、喜马拉雅等公司分别发布了自己的智能音箱产品,更多的智能音箱还在路上。这时距离亚马逊Echo的发布,已经过去差不多3年时间。
各大公司纷纷入手智能音箱的背后,实则反映出产业界对人工智能时代的焦虑。
智能音箱非音箱
时下所流行的智能音箱,实则与音响没太大关系,多为语音交互设备,而语音交互则被普遍认为是未来人工智能时代的主要交互方式。于是,一大批被冠以智能音箱名号的语音交互硬件出现了,其目的是抢占未来的语音交互入口,并不是要做什么音箱。互联网厂商的逻辑是,目前的智能音箱能控制音乐播放,天气播报,未来就能控制冰箱和洗衣机的运行,进而控制物联网的一切。
与实现这一控制需要大投入的后台算法和自动化技术研发相比,目前业已成熟的语音交互,实则是加入到人工智能大潮中一条低成本的捷径了。
“不想被技术热潮甩下”“见到风口都想参与一下”“在不进行高成本投入的情况下也成为人工智能产业的一员”“吃不上肉至少喝口汤,反正不管自己出力多少,也不想这桌酒席上没有自己”……这些想法成为近期发布智能音箱企业的普遍心态。真正在人工智能领域进行持续投入的大公司如百度,或者在语音交互方面拥有极强技术实力的企业如三星,反倒对智能音箱这个风口没表现出那么热衷。这些企业的态度,映射出了该领域的意见分歧。
入口和内核的博弈
业界认为,智能音箱有可能会是未来物联网和智能家居的入口,因为似乎没有比自然语音更好的人机交互方式了。虽然肯加入进来的智能家居厂商很罕见,但智能音箱只要不断迭代產品,将其语音交互功能不断升级换代至消费者可自如使用的地步,智能家居厂商的加入,只是早晚的问题。届时,目前这批智能音箱厂商就会与之分享利益,并通过拔高自身语音交互入口价值而获得更多利益,成为出力最少但获收益最多的所谓入口把控者。这是一种传统互联网的固有商业逻辑,但在未来能否奏效还真不好说。
一套用人工智能控制的家居产品,技术难度主要在自动化控制上面,机器在接收并理解了语音指令之后,还需要对这些指令加以执行,如开机、关机、升温、降温、大火煮、小火煮、焖煮等。传统按键控制的情况下,这类动作的执行是很简单的,但在语音控制的状态下,其实现难度就要大得多了,这是互联网企业做不了的事情。百度这样的人工智能巨头,也只能是在算法方面不断突破,但涉及到具体的自动化控制时,还是具体的生产制造企业更为擅长。
键盘与主机之争
智能音箱与物联网和智能家居之间,存在这一种类似于电脑与键盘的关系,没有键盘当然是无法输入文字,但没有电脑的话,键盘会更加处于无用之地。
首先,家电业是否心甘情愿地只去生产电脑,把键盘的事情交给别人去做?智能家居企业为了能够不受制于人,始终不肯开放接口,虽然成立过一些开放标准平台,最后都无果而终。因此,如今不管是Echo也好,Rokid也好,都不具备对智能家居的控制功能。在消费端,用一个终端对所有电器进行控制当然是最好的体验,但实际上做不到,由于各个企业之间纷繁复杂的利益关系存在,没有谁能在这方面一统天下。另一方面,各企业在标准协议方面不能达成一致的情况下,又不能让消费者家里只用长虹,或者只用海尔。物联网的最大组成部分是智能家居,但家电企业对自身利益的保护,是超越外界想象的。能自己做的都会自己做,更别提放弃键盘只做主机了。
其次,物联网能不能绕开智能音箱,用别的方式实现语音交互?肯定有。
百度发布的DuerOs就是这样一套系统,可以让企业通过SDK嵌入的方式,将语音交互甚至图像识别集成到智能家电中去。当然,这是进入智能家电的另一个入口,也走不出被第三方控制的怪圈。但这种生态输出能力的方式平滑更容易让企业接受。三星目前正在着力发展软件形式的Bixby语音助手,这种搭载在三星智能手机和其他硬件上的软件语音助手,未来很可能也会走DuerOs这种生态型路子,顺滑过渡到智能电器上去。如果这两大势力中任何一个能成,智能音箱也就没有任何意义了。
再次,人机交互有没有语音之外的其他方式?只能说一切皆有可能。人工智能的两大入口分别是语音和图像识别,目前前者的技术比后者成熟,图像识别还存在着较大的技术难关有待突破。如果图像识别能够对人体细微的动作进行精确理解,其实手势交互或许会是比语音更好的交互方式。设想一下,用户坐在沙发上手指向上一划,空调升温,向下一划,空调降温,这也是很不错的体验。语音交互的最大障碍是口音和语音环境,而机器对手势和身体语言的识别,则不受这些条件影响。
风口难蹭
近期智能音箱的密集出现,是风口论的又一次集中体现。企业把智能音箱的价格定得很低,试图用补贴硬件的方式抢占市场,但其实这一目的很难实现。未来的人工智能产业中,或许根本没有蹭风口势力的些微容身之地,可以肯定的是绝大多数智能音箱将从市场上消失。当前智能音箱的繁荣和风口,只不过映射出互联网企业对人工智能时代的焦虑而已,它们给市场提供的,只不过是同质化的产品和服务,从长远来看根本不是个可以持续做下去的事情。
事实上,即便语音交互是未来较为强力的人工智能入口,也很有可能不会是智能音箱这种形式,语音交互的泛终端化或无终端化才是方向,即声音传感器无处不在,根本不需要一个有形终端摆在那里起作用。不过,一些市场份额较高的音响,如Echo们,或许并不会在这个项目上一败涂地,Echo至少还能控制一些无形的互联网服务,甚至对某些家用照明装置进行控制。
至于那些从现在起才开始跟风的企业,前景实难描述。只能说,前景有天花板,而惨烈不设底线。
在2014年11月,亚马逊就低调发布智能音箱 Echo。当时它给整个业界带来的印象,只是一款创新的硬件产品,可通过语音交互播放音乐,播报天气,闹钟提醒等,做一些简单的服务输出。在一向紧盯美国科技界创新发展的中国,鲜有追随者。但到了2016年11月,Echo在美国的销量已经达到了3 510万台。
到2016年,根据市场调研机构Strategy Analytics 的数据,2016年智能音箱全球出货量为590万台,并将在2022年增长10倍,市场规模将达到55亿美元。
风口似乎出现了。
2017年,微软的Invoke和苹果的Home pod发布之后,数得上的巨头已悉数入局,这在中国引发了一场跟风潮。天猫、联想、喜马拉雅等公司分别发布了自己的智能音箱产品,更多的智能音箱还在路上。这时距离亚马逊Echo的发布,已经过去差不多3年时间。
各大公司纷纷入手智能音箱的背后,实则反映出产业界对人工智能时代的焦虑。
智能音箱非音箱
时下所流行的智能音箱,实则与音响没太大关系,多为语音交互设备,而语音交互则被普遍认为是未来人工智能时代的主要交互方式。于是,一大批被冠以智能音箱名号的语音交互硬件出现了,其目的是抢占未来的语音交互入口,并不是要做什么音箱。互联网厂商的逻辑是,目前的智能音箱能控制音乐播放,天气播报,未来就能控制冰箱和洗衣机的运行,进而控制物联网的一切。
与实现这一控制需要大投入的后台算法和自动化技术研发相比,目前业已成熟的语音交互,实则是加入到人工智能大潮中一条低成本的捷径了。
“不想被技术热潮甩下”“见到风口都想参与一下”“在不进行高成本投入的情况下也成为人工智能产业的一员”“吃不上肉至少喝口汤,反正不管自己出力多少,也不想这桌酒席上没有自己”……这些想法成为近期发布智能音箱企业的普遍心态。真正在人工智能领域进行持续投入的大公司如百度,或者在语音交互方面拥有极强技术实力的企业如三星,反倒对智能音箱这个风口没表现出那么热衷。这些企业的态度,映射出了该领域的意见分歧。
入口和内核的博弈
业界认为,智能音箱有可能会是未来物联网和智能家居的入口,因为似乎没有比自然语音更好的人机交互方式了。虽然肯加入进来的智能家居厂商很罕见,但智能音箱只要不断迭代產品,将其语音交互功能不断升级换代至消费者可自如使用的地步,智能家居厂商的加入,只是早晚的问题。届时,目前这批智能音箱厂商就会与之分享利益,并通过拔高自身语音交互入口价值而获得更多利益,成为出力最少但获收益最多的所谓入口把控者。这是一种传统互联网的固有商业逻辑,但在未来能否奏效还真不好说。
一套用人工智能控制的家居产品,技术难度主要在自动化控制上面,机器在接收并理解了语音指令之后,还需要对这些指令加以执行,如开机、关机、升温、降温、大火煮、小火煮、焖煮等。传统按键控制的情况下,这类动作的执行是很简单的,但在语音控制的状态下,其实现难度就要大得多了,这是互联网企业做不了的事情。百度这样的人工智能巨头,也只能是在算法方面不断突破,但涉及到具体的自动化控制时,还是具体的生产制造企业更为擅长。
键盘与主机之争
智能音箱与物联网和智能家居之间,存在这一种类似于电脑与键盘的关系,没有键盘当然是无法输入文字,但没有电脑的话,键盘会更加处于无用之地。
首先,家电业是否心甘情愿地只去生产电脑,把键盘的事情交给别人去做?智能家居企业为了能够不受制于人,始终不肯开放接口,虽然成立过一些开放标准平台,最后都无果而终。因此,如今不管是Echo也好,Rokid也好,都不具备对智能家居的控制功能。在消费端,用一个终端对所有电器进行控制当然是最好的体验,但实际上做不到,由于各个企业之间纷繁复杂的利益关系存在,没有谁能在这方面一统天下。另一方面,各企业在标准协议方面不能达成一致的情况下,又不能让消费者家里只用长虹,或者只用海尔。物联网的最大组成部分是智能家居,但家电企业对自身利益的保护,是超越外界想象的。能自己做的都会自己做,更别提放弃键盘只做主机了。
其次,物联网能不能绕开智能音箱,用别的方式实现语音交互?肯定有。
百度发布的DuerOs就是这样一套系统,可以让企业通过SDK嵌入的方式,将语音交互甚至图像识别集成到智能家电中去。当然,这是进入智能家电的另一个入口,也走不出被第三方控制的怪圈。但这种生态输出能力的方式平滑更容易让企业接受。三星目前正在着力发展软件形式的Bixby语音助手,这种搭载在三星智能手机和其他硬件上的软件语音助手,未来很可能也会走DuerOs这种生态型路子,顺滑过渡到智能电器上去。如果这两大势力中任何一个能成,智能音箱也就没有任何意义了。
再次,人机交互有没有语音之外的其他方式?只能说一切皆有可能。人工智能的两大入口分别是语音和图像识别,目前前者的技术比后者成熟,图像识别还存在着较大的技术难关有待突破。如果图像识别能够对人体细微的动作进行精确理解,其实手势交互或许会是比语音更好的交互方式。设想一下,用户坐在沙发上手指向上一划,空调升温,向下一划,空调降温,这也是很不错的体验。语音交互的最大障碍是口音和语音环境,而机器对手势和身体语言的识别,则不受这些条件影响。
风口难蹭
近期智能音箱的密集出现,是风口论的又一次集中体现。企业把智能音箱的价格定得很低,试图用补贴硬件的方式抢占市场,但其实这一目的很难实现。未来的人工智能产业中,或许根本没有蹭风口势力的些微容身之地,可以肯定的是绝大多数智能音箱将从市场上消失。当前智能音箱的繁荣和风口,只不过映射出互联网企业对人工智能时代的焦虑而已,它们给市场提供的,只不过是同质化的产品和服务,从长远来看根本不是个可以持续做下去的事情。
事实上,即便语音交互是未来较为强力的人工智能入口,也很有可能不会是智能音箱这种形式,语音交互的泛终端化或无终端化才是方向,即声音传感器无处不在,根本不需要一个有形终端摆在那里起作用。不过,一些市场份额较高的音响,如Echo们,或许并不会在这个项目上一败涂地,Echo至少还能控制一些无形的互联网服务,甚至对某些家用照明装置进行控制。
至于那些从现在起才开始跟风的企业,前景实难描述。只能说,前景有天花板,而惨烈不设底线。