论文部分内容阅读
近两年,互联网行业日新月异,经历了AR、VR的变革,而在2017年的下半年,AI这个词也频频出现,人工智能似乎离我们越来越近。通常,每一次全新时代的到来,都是因为一个传统的形式被颠覆。
创新工场董事长李开复曾在一次采访中说:“人工智能将快速爆发,10年后50%的人类工作将被AI取代。”AI时代的到来,语音识别便是入场券。说出一句话,也许你可以直接听到想要的结果,也许机器会直接执行你的命令,也许……这无限延伸的可能性,便是AI的魅力。有一家专注于认知计算、自然语言理解技术的公司创始人说:“在物联网时代真正到来时,语音交互将极大地改变人类现有的生活方式。”而这家公司旗下的小蓦(Mor)智能交互引擎,对外提供人机协作、智能对话整体解决方案,是国内唯一一家能够全语音完成复杂任务的决策引擎。这家公司就是北京蓦然认知科技有限公司(简称“蓦然认知”)。
近日,本刊记者对蓦然认知CEO戴帅湘进行了独家专访。
蓦然认知 应运而生
蓦然认知于2017年12月20日在北京举行了首场全球发布会,吸引了不少专业大咖及媒体参与。创立于2016年5月的蓦然认知,经过一年多的发展,已经成为智能语音交互领域的耀眼新星。从一整套智能语音交互系统到软硬一体解决方案,从自然语言人机交互到打通全语音服务闭环,蓦然认知一路走来,取得了一系列喜人的成绩与技术成果。
在蓦然认知发布会上,现场演示的多个应用场景,让大家见证了蓦然的魅力。蓦然认知提出的“对话即应用”理念,重新定义了人机交互。用户可以直接通过语音对话获取想要的所有服务,此外,VUI+GUI的融合,让人机交互变得更高效、体验度更好。
蓦然认知是如何诞生的呢?这一切要从蓦然认知的创始人戴帅湘说起。
采访时记者了解到,戴帅湘是前百度主任架构师,曾长期担任百度Query理解方向负责人,荣获百度语义技术的最高奖。他在2010年提出“Query改写模型”方案,提升了百度引擎的搜索相关技术,带来大幅广告收益;他坐拥20多项专利技术,分布在自然语言处理、语义搜索、自动问题求解等多个领域。
记者好奇地问道:为何放弃在百度稳定又令人羡慕的高薪职位,创立蓦然认知呢?
戴帅湘告诉记者.“我在百度9年,见证了互联网红利时代的两轮高峰:第一轮开始于2001年,信息交流打破了时空界限,网页和浏览器逐渐普及;第二轮开始于2010年,移动互联网兴起,手机从一开始的拨打电话、发送短信功能,转变为可以使用各种APP的智能手机。苹果发布Siri,亚马逊开放语音技术Alexa,微软语音助手‘小娜’、 ‘小冰’相继诞生,国内科大讯飞也推出了一款语音助手‘灵犀’——智能交互时代汹涌而来。”
戴帅湘认为,在IoT时代,语音交互会成为下一個新风口。在物联网时代,屏幕交互的方式将不再是主流,取而代之的会是更接近人与人之间的交互方式——语音、动作、传感器的自动检测。语音交互,是最贴近人类的原始交流方式,最自然、最直接、最主流。下一代搜索引擎就是AI的时代。我自己一直从事的就是NLP,时代到了,就自然而然地创立了蓦然认知。
“众里寻她千百度,蓦然回首,那人却在灯火阑珊处。”
戴帅湘说: “从零几年开始,百度做的一直是搜索引擎,目前搜索引擎的应用形态已经固定,即使是糅合了语音输入搜索内容的方式,搜索也并非用户的最终目的。目前的搜索引擎主要是在电脑、手机端使用,这些硬件设备也都达到了一个存量的市场。在百度的经验让我见证了搜索引擎的崛起,也看到了新的机遇。物联网的崛起、智能硬件设备的更迭,让我们更清楚地看到搜索引擎的走向。蓦然认知就应运而生了,我们专注于打造的是决策引擎。”
此外,记者在此次采访中还了解到,目前,蓦然认知已将技术落地应用于智能电视与车载硬件设备,并与众多电视厂商与汽车厂商达成合作。
领先NLP技术,成为资本市场的“宠儿”
随着语音交互的变革,先行的语音信号处理能力和随后的NLP技术缺一不可。科大讯飞这类老牌的语音公司已聚合了足够强的实力,但不意味着从NLP切入的初创公司没有弯道超车的可能。
“我们是从后往前走,他们是从前往后走。”戴帅湘如此形容。拥有了NLP的领先技术,蓦然认知还要回头加强自身的语音信号处理能力等薄弱环节。
据了解,蓦然认知总部位于北京市海淀区清华科技园。蓦然认知旗下的小蓦(Mor)智能交互引擎,是国内唯一一套能够全语音完成复杂任务的决策引擎。Mor作为交互机器人,可为智能硬件等设备制造商提供流畅的人机对话、精准的语义理解以及知识推理和自动化服务对接功能,可以全语音、全自动完成车载交互、家居交互、客服问答等工作,并可以替代特定场景下的人工服务,如餐馆服务员、公司前台和客服、场馆导游.个人助理等,是一个可以快速移植、实时学习、多场景融合的机器人交互及决策系统。
采访中,谈及蓦然认知在(智能语音交互)NLP领域的优势,戴帅湘说: “NLP就是要让机器理解人的语言,而且更为重要的是让机器以人的方式与人类进行自然沟通。所以很多公司会用对话轮次来评估产品的对话能力。蓦然认知在NLP方面可以覆盖多个场景,而这些场景不是一个个分开实现的,我们先做了一个场景,然后引入新场景不断迭代,进而铺开场景覆盖面,而且越铺越快,这是一个快速学习和移植的机制。多个场景的融合能力,是我们的技术优势。在对话交互上,我们可以实现精准理解、快速响应,这都得益于我们的技术能力和架构能力。多轮对话和多场景的融合,都得益于我们有通用的对话模型,而不是仅局限于几个场景。具备知识才能进行对话和交互,我们也拥有自己的知识图谱。另外,蓦然认知的一个亮点就是实现了多服务闭环,外卖、电影票等已经接入我们的产品,后续我们的技术还会支持更多的服务和内容以及后续链条服务。我们一直倡导技术有产品的思维,产品有技术的储备,技术和产品同步做好了,产品才能越做越好。” 蓦然认知成立至今尽管不到两年的时间,却在资本寒冬得到了资本市场的青睐。在2016年6月30日,天使轮,获得襄禾资本、经纬中国的200万美元投资;2016年12月31日,A轮获得1000万美元,投资方分别为:经纬中国、源码资本。
很多创业型公司都没能扛过资本寒冬,最终只能说声“Byebye”。蓦然认知不仅顺利地度过了资本寒冬,还赢得了投资市场的热捧。
戴帅湘对此表示:“蓦然认知能够被资本市场看好的主要因素,一个是我们的技术过硬;再一个是我们2016年5月成立,很快就有产品形态出来,而且蓦然认知自一开始的目标就十分明确。其实技术可能很多家都有,但是最主要的是怎样运用技术,怎样把技术产品化,将产品推给目标群体。蓦然认知在做的不是一个技术点和一个产品的事情,而是创造一个全新的稳定的产业生态。虽然AI很火,资本市场也急于涌入,但投资人是理智的。被看好也是对蓦然认知市场定位和产品的认可,我们会继续坚定地走下去。”
创造全新产业生态链
蓦然认知在北京的发布会上发布新一代决策引擎MorUI 2.0,主打千人千面、高效自然的人机交互服务。
MorUI 2.0的个性化、多轮交互场景是这样的。
男主人问:最近有什么新闻?
搭载该引擎的电視开始播报体育+科技新闻。
女主人问:最近有什么新鲜事?
搭载该引擎的电视直接播放《演员的诞生》和袁立的短视频新闻。
女主人还可以继续发问:《演员的诞生》最新一期什么时间播?袁立演过什么?她得过什么奖?她是什么星座?
在现阶段,图像识别、语音识别的准确率已经达到一定程度,但自然语言处理仍处在攻坚期。要让机器真正实现智能,必须提升语义理解的准确度与可用性。蓦然认知想做的,就是实现人机间的多轮对话,让上述场景更加顺畅自然。
智能语音交互在目前还存在着哪些难点?戴帅湘告诉记者: “其实蓦然认知是在做剥离语音之后的部分,更准确地说是对话交互。语音识别可以说是很成熟了,所以我们专注于对话交互。做对话交互是从交互方式的需求出发的,对话交互本身其实是很难做的。语言本身的歧义性其实在交互上影响是比较大的,蓦然认知现在可以做到结合场景和UI来消解部分歧义。想要做到智能其实是两个层面上的事,一个是技术的成熟度,一个是产品设计及思路,在这两个层面上蓦然认知都倾注了很多心血。其实,让用户有更好的体验,用户的行为预测和智能决策的能力也是对话交互需要倾注精力的地方。蓦然认知希望不仅能够理解用户的话语,还能为用户提供更好的交互和辅助决策。”
在物联网时代真正到来时,语音交互将极大地改变人类现有的生活方式。作为一个工程师,戴帅湘有着技术驱动社会变革的远大理想。 “技术本身是发展,我一直跑在这个赛道上面,一直在做NLP技术,没有停歇。”
采访中谈及对人工智能未来前景有哪些期许和看法,戴帅湘表示:“人工智能还是辅助人的,其实人工智能的路还很长,蓦然认知在做的事情我认为是非常有意义的。我希望人工智能能够给人类的生活带来方便,车、飞机的发明将世界连接,其实也把人局限在了一个固定的空间里,而人工智能可以做到将空间延伸。我们希望未来,人工智能可以帮助人打破更多的壁垒和局限,辅助人的方方面面。”
在采访即将结束时,记者问及蓦然认知在近几年有怎样的战略规划或长远发展目标?戴帅湘非常坦诚地告诉记者: “蓦然认知从一开始就专注在两个场景——车载和家居。家居场景下的智能电视,我们已经与暴风TV达成合作,而且也在与其他厂商谈合作。家居场景的面已经铺开了,接下来就是继续优化迭代,让我们的产品更好地落地到智能硬件上。发布会上推出的MorUI 2.O就是希望为各种需求的客户提供服务,在落地产品优化体验的过程中,共同用智能带动产业升级,提升用户体验。”
此外,戴帅湘还向记者透露:“针对车载场景,蓦然团队在上海建立了分公司,2018年会着重推进与车厂的合作。目前车虽然是存量市场,但是它的联网率很低,随着无人驾驶的到来,人在车载场景下会被逐渐解放出来,车的功能性将不再局限在代步工具上。我们希望能够为这些传统的家电带来新的生态,构建一个新的产业链条,为硬件厂商、为服务内容提供商构建一个平台、一个生态,这是蓦然认知长远的目标。”
创新工场董事长李开复曾在一次采访中说:“人工智能将快速爆发,10年后50%的人类工作将被AI取代。”AI时代的到来,语音识别便是入场券。说出一句话,也许你可以直接听到想要的结果,也许机器会直接执行你的命令,也许……这无限延伸的可能性,便是AI的魅力。有一家专注于认知计算、自然语言理解技术的公司创始人说:“在物联网时代真正到来时,语音交互将极大地改变人类现有的生活方式。”而这家公司旗下的小蓦(Mor)智能交互引擎,对外提供人机协作、智能对话整体解决方案,是国内唯一一家能够全语音完成复杂任务的决策引擎。这家公司就是北京蓦然认知科技有限公司(简称“蓦然认知”)。
近日,本刊记者对蓦然认知CEO戴帅湘进行了独家专访。
蓦然认知 应运而生
蓦然认知于2017年12月20日在北京举行了首场全球发布会,吸引了不少专业大咖及媒体参与。创立于2016年5月的蓦然认知,经过一年多的发展,已经成为智能语音交互领域的耀眼新星。从一整套智能语音交互系统到软硬一体解决方案,从自然语言人机交互到打通全语音服务闭环,蓦然认知一路走来,取得了一系列喜人的成绩与技术成果。
在蓦然认知发布会上,现场演示的多个应用场景,让大家见证了蓦然的魅力。蓦然认知提出的“对话即应用”理念,重新定义了人机交互。用户可以直接通过语音对话获取想要的所有服务,此外,VUI+GUI的融合,让人机交互变得更高效、体验度更好。
蓦然认知是如何诞生的呢?这一切要从蓦然认知的创始人戴帅湘说起。
采访时记者了解到,戴帅湘是前百度主任架构师,曾长期担任百度Query理解方向负责人,荣获百度语义技术的最高奖。他在2010年提出“Query改写模型”方案,提升了百度引擎的搜索相关技术,带来大幅广告收益;他坐拥20多项专利技术,分布在自然语言处理、语义搜索、自动问题求解等多个领域。
记者好奇地问道:为何放弃在百度稳定又令人羡慕的高薪职位,创立蓦然认知呢?
戴帅湘告诉记者.“我在百度9年,见证了互联网红利时代的两轮高峰:第一轮开始于2001年,信息交流打破了时空界限,网页和浏览器逐渐普及;第二轮开始于2010年,移动互联网兴起,手机从一开始的拨打电话、发送短信功能,转变为可以使用各种APP的智能手机。苹果发布Siri,亚马逊开放语音技术Alexa,微软语音助手‘小娜’、 ‘小冰’相继诞生,国内科大讯飞也推出了一款语音助手‘灵犀’——智能交互时代汹涌而来。”
戴帅湘认为,在IoT时代,语音交互会成为下一個新风口。在物联网时代,屏幕交互的方式将不再是主流,取而代之的会是更接近人与人之间的交互方式——语音、动作、传感器的自动检测。语音交互,是最贴近人类的原始交流方式,最自然、最直接、最主流。下一代搜索引擎就是AI的时代。我自己一直从事的就是NLP,时代到了,就自然而然地创立了蓦然认知。
“众里寻她千百度,蓦然回首,那人却在灯火阑珊处。”
戴帅湘说: “从零几年开始,百度做的一直是搜索引擎,目前搜索引擎的应用形态已经固定,即使是糅合了语音输入搜索内容的方式,搜索也并非用户的最终目的。目前的搜索引擎主要是在电脑、手机端使用,这些硬件设备也都达到了一个存量的市场。在百度的经验让我见证了搜索引擎的崛起,也看到了新的机遇。物联网的崛起、智能硬件设备的更迭,让我们更清楚地看到搜索引擎的走向。蓦然认知就应运而生了,我们专注于打造的是决策引擎。”
此外,记者在此次采访中还了解到,目前,蓦然认知已将技术落地应用于智能电视与车载硬件设备,并与众多电视厂商与汽车厂商达成合作。
领先NLP技术,成为资本市场的“宠儿”
随着语音交互的变革,先行的语音信号处理能力和随后的NLP技术缺一不可。科大讯飞这类老牌的语音公司已聚合了足够强的实力,但不意味着从NLP切入的初创公司没有弯道超车的可能。
“我们是从后往前走,他们是从前往后走。”戴帅湘如此形容。拥有了NLP的领先技术,蓦然认知还要回头加强自身的语音信号处理能力等薄弱环节。
据了解,蓦然认知总部位于北京市海淀区清华科技园。蓦然认知旗下的小蓦(Mor)智能交互引擎,是国内唯一一套能够全语音完成复杂任务的决策引擎。Mor作为交互机器人,可为智能硬件等设备制造商提供流畅的人机对话、精准的语义理解以及知识推理和自动化服务对接功能,可以全语音、全自动完成车载交互、家居交互、客服问答等工作,并可以替代特定场景下的人工服务,如餐馆服务员、公司前台和客服、场馆导游.个人助理等,是一个可以快速移植、实时学习、多场景融合的机器人交互及决策系统。
采访中,谈及蓦然认知在(智能语音交互)NLP领域的优势,戴帅湘说: “NLP就是要让机器理解人的语言,而且更为重要的是让机器以人的方式与人类进行自然沟通。所以很多公司会用对话轮次来评估产品的对话能力。蓦然认知在NLP方面可以覆盖多个场景,而这些场景不是一个个分开实现的,我们先做了一个场景,然后引入新场景不断迭代,进而铺开场景覆盖面,而且越铺越快,这是一个快速学习和移植的机制。多个场景的融合能力,是我们的技术优势。在对话交互上,我们可以实现精准理解、快速响应,这都得益于我们的技术能力和架构能力。多轮对话和多场景的融合,都得益于我们有通用的对话模型,而不是仅局限于几个场景。具备知识才能进行对话和交互,我们也拥有自己的知识图谱。另外,蓦然认知的一个亮点就是实现了多服务闭环,外卖、电影票等已经接入我们的产品,后续我们的技术还会支持更多的服务和内容以及后续链条服务。我们一直倡导技术有产品的思维,产品有技术的储备,技术和产品同步做好了,产品才能越做越好。” 蓦然认知成立至今尽管不到两年的时间,却在资本寒冬得到了资本市场的青睐。在2016年6月30日,天使轮,获得襄禾资本、经纬中国的200万美元投资;2016年12月31日,A轮获得1000万美元,投资方分别为:经纬中国、源码资本。
很多创业型公司都没能扛过资本寒冬,最终只能说声“Byebye”。蓦然认知不仅顺利地度过了资本寒冬,还赢得了投资市场的热捧。
戴帅湘对此表示:“蓦然认知能够被资本市场看好的主要因素,一个是我们的技术过硬;再一个是我们2016年5月成立,很快就有产品形态出来,而且蓦然认知自一开始的目标就十分明确。其实技术可能很多家都有,但是最主要的是怎样运用技术,怎样把技术产品化,将产品推给目标群体。蓦然认知在做的不是一个技术点和一个产品的事情,而是创造一个全新的稳定的产业生态。虽然AI很火,资本市场也急于涌入,但投资人是理智的。被看好也是对蓦然认知市场定位和产品的认可,我们会继续坚定地走下去。”
创造全新产业生态链
蓦然认知在北京的发布会上发布新一代决策引擎MorUI 2.0,主打千人千面、高效自然的人机交互服务。
MorUI 2.0的个性化、多轮交互场景是这样的。
男主人问:最近有什么新闻?
搭载该引擎的电視开始播报体育+科技新闻。
女主人问:最近有什么新鲜事?
搭载该引擎的电视直接播放《演员的诞生》和袁立的短视频新闻。
女主人还可以继续发问:《演员的诞生》最新一期什么时间播?袁立演过什么?她得过什么奖?她是什么星座?
在现阶段,图像识别、语音识别的准确率已经达到一定程度,但自然语言处理仍处在攻坚期。要让机器真正实现智能,必须提升语义理解的准确度与可用性。蓦然认知想做的,就是实现人机间的多轮对话,让上述场景更加顺畅自然。
智能语音交互在目前还存在着哪些难点?戴帅湘告诉记者: “其实蓦然认知是在做剥离语音之后的部分,更准确地说是对话交互。语音识别可以说是很成熟了,所以我们专注于对话交互。做对话交互是从交互方式的需求出发的,对话交互本身其实是很难做的。语言本身的歧义性其实在交互上影响是比较大的,蓦然认知现在可以做到结合场景和UI来消解部分歧义。想要做到智能其实是两个层面上的事,一个是技术的成熟度,一个是产品设计及思路,在这两个层面上蓦然认知都倾注了很多心血。其实,让用户有更好的体验,用户的行为预测和智能决策的能力也是对话交互需要倾注精力的地方。蓦然认知希望不仅能够理解用户的话语,还能为用户提供更好的交互和辅助决策。”
在物联网时代真正到来时,语音交互将极大地改变人类现有的生活方式。作为一个工程师,戴帅湘有着技术驱动社会变革的远大理想。 “技术本身是发展,我一直跑在这个赛道上面,一直在做NLP技术,没有停歇。”
采访中谈及对人工智能未来前景有哪些期许和看法,戴帅湘表示:“人工智能还是辅助人的,其实人工智能的路还很长,蓦然认知在做的事情我认为是非常有意义的。我希望人工智能能够给人类的生活带来方便,车、飞机的发明将世界连接,其实也把人局限在了一个固定的空间里,而人工智能可以做到将空间延伸。我们希望未来,人工智能可以帮助人打破更多的壁垒和局限,辅助人的方方面面。”
在采访即将结束时,记者问及蓦然认知在近几年有怎样的战略规划或长远发展目标?戴帅湘非常坦诚地告诉记者: “蓦然认知从一开始就专注在两个场景——车载和家居。家居场景下的智能电视,我们已经与暴风TV达成合作,而且也在与其他厂商谈合作。家居场景的面已经铺开了,接下来就是继续优化迭代,让我们的产品更好地落地到智能硬件上。发布会上推出的MorUI 2.O就是希望为各种需求的客户提供服务,在落地产品优化体验的过程中,共同用智能带动产业升级,提升用户体验。”
此外,戴帅湘还向记者透露:“针对车载场景,蓦然团队在上海建立了分公司,2018年会着重推进与车厂的合作。目前车虽然是存量市场,但是它的联网率很低,随着无人驾驶的到来,人在车载场景下会被逐渐解放出来,车的功能性将不再局限在代步工具上。我们希望能够为这些传统的家电带来新的生态,构建一个新的产业链条,为硬件厂商、为服务内容提供商构建一个平台、一个生态,这是蓦然认知长远的目标。”