论文部分内容阅读
在2013年的电影《她》中,Joaquin Phoenix饰演了一个和他的云端操作系统(Scarlett Johansson配音)相爱的角色。“她”能够预测男主角的情感,安排他的计划。他所需要做的就是和“她”对话。导演Spike Jonze将这个剧情设定在不久的未来,但是,旧金山Expect Lab的创始人兼CEO Tim Tuttle表示可以进行预判处理的应用现在已经存在。他说:“在最近两年,我们见证了语音识别和人工智能研究的发展,比之前的准确率提高了30%。这两年的成果比过去十年的成果都大。”
Tuttle毕业于MIT,然后进入了贝尔实验室,自上世纪九十年代以来一直致力于语音识别背后的人工智能领域。他表示苹果的Siri和谷歌的Google Now对语音识别技术的进步做出了很大的贡献。在智能手机上使用语音下指令启动APP、搜索内容的人越多,人工智能的水平就会越高。
针对智能手表和其他可穿戴设备、车内信息娱乐系统和新一代物联网家电,他表示:“未来五年将发布的大多数新设备都不会有键盘。”
如果Tuttle的预测成真,Expect Lab的云端语音识别和机器学习软件MindMeld将会是这次转变中所必需的部分。这个软件让每个人都可以通过其手机APP使用语音识别功能。他说:“你打开这个APP,按住屏幕上的麦克风按钮,然后下达指令。”因为你是在特定的APP中搜索数据,搜索结果将比Siri和Google Now更快、更准确。
Tuttle说:“人们将会在这款APP上有更好的使用体验,因为Siri或者Google Now不能做到像这款APP那样将数据进行精细化和专门化处理。”他接着说道:“至少在美式英语上我们已经解决了准确识别这个问题,语音技术现在也能够比房间中大部分人更好地理解正在讲的内容。我们现在要研究的是如何处理掉背景噪音和其他无效的声音、如何准确理解各地方言和一些不太常用的语言。”
现在已有超过1200家公司在他们的用户界面使用MindMeld来提供语音识别服务。Tuttle不愿意提供客户详情,但他表示他的客户中包括一家大型有线电视公司、一家全球化汽车制造商和一些政府情报机构。除此之外,还有许多移动APP开发公司也是他的客户。这些开发公司能将MindMeld加入到其客户的APP中。用户可以免费使用MindMeld完成1000次语音搜索,之后可根据实际使用次数每月缴纳49美元(最多可进行1万次语音搜索)到1999美元(最多可进行80万次语音搜索)不等。
Tuttle相信,到今年年底,移动设备上附带语音识别技术的应用占比将增长到40%。他认为三年后语音技术将会是我们所用设备的客户界面里最基本的配置。他表示:“我们现如今还处于语音技术探索的初级阶段。但也许只需要再过5?10年的时间我们就能研发出《钢铁侠》中Tony Stark用的声控电脑Jarvis那样的产品。”
更多的杰出科技
Asus Chromebit可以通过HDMI接口与任何一个显示器或者电视连接,如果再接入蓝牙键盘和鼠标,就可以成为一台内置2GB内存和16GB固态硬盘、带有一个USB接口、具备Wi-Fi功能的Chromebook迷你电脑。
Saygus V2是一款超级智能手机,能够将影像通过无线HD传输技术同步至大屏幕显示,可无线充电,拥有Harmon Kardon 3D立体声、2100万像素摄像头及320GB容量,同时手机已进行防水处理。
将Panono的球型全景摄像机抛向天空,你可以通过Panono的APP看到拍好的360度无死角照片。
瑞典的Penclic设计了一款符合人体工学的鼠标,鼠标无论从外观、感受还是使用上都像钢笔一样。
虽然Apple Watch看上去很酷,但是它需要一台iPhone才能工作。而Spur的Atomic智能手表能够直接通过Google Play下载应用满足用户的基础需要——通话、发信息、发邮件、浏览社交媒体,而不需要有一台智能手机在旁边。
Biomeme可以将iPhone变成一个诊断工具。它能够针对多种疾病快速检验血液、尿液和粪便样本,同时还能够检测犯罪现场的DNA。它甚至已经可以对埃博拉病毒进行检测。
Loopwheels重新设计的车轮采用了碳素弹簧钢悬架装置。新的车轮减轻了震动,吸收了路面颠簸带来的冲击,为轮椅和自行车使用者带来更轻便、更平滑的体验。
通过蓝牙技术,Ilumi LED灯泡的使用者可以调整灯光颜色和亮度,设置灯光定时开关,让灯光随音乐同步变幻,并且可以根据自己的作息时间进行智能调节。
堪称“无人机中心站”的Airware的航空信息平台Aerial Information Platform拥有操控一队无人机所需要的一切条件。人们在采用Windows系统的笔记本或者平板电脑上就可以正常控制。平台会保证无人机按照联邦航空局的规定航行。
Tuttle毕业于MIT,然后进入了贝尔实验室,自上世纪九十年代以来一直致力于语音识别背后的人工智能领域。他表示苹果的Siri和谷歌的Google Now对语音识别技术的进步做出了很大的贡献。在智能手机上使用语音下指令启动APP、搜索内容的人越多,人工智能的水平就会越高。
针对智能手表和其他可穿戴设备、车内信息娱乐系统和新一代物联网家电,他表示:“未来五年将发布的大多数新设备都不会有键盘。”
如果Tuttle的预测成真,Expect Lab的云端语音识别和机器学习软件MindMeld将会是这次转变中所必需的部分。这个软件让每个人都可以通过其手机APP使用语音识别功能。他说:“你打开这个APP,按住屏幕上的麦克风按钮,然后下达指令。”因为你是在特定的APP中搜索数据,搜索结果将比Siri和Google Now更快、更准确。
Tuttle说:“人们将会在这款APP上有更好的使用体验,因为Siri或者Google Now不能做到像这款APP那样将数据进行精细化和专门化处理。”他接着说道:“至少在美式英语上我们已经解决了准确识别这个问题,语音技术现在也能够比房间中大部分人更好地理解正在讲的内容。我们现在要研究的是如何处理掉背景噪音和其他无效的声音、如何准确理解各地方言和一些不太常用的语言。”
现在已有超过1200家公司在他们的用户界面使用MindMeld来提供语音识别服务。Tuttle不愿意提供客户详情,但他表示他的客户中包括一家大型有线电视公司、一家全球化汽车制造商和一些政府情报机构。除此之外,还有许多移动APP开发公司也是他的客户。这些开发公司能将MindMeld加入到其客户的APP中。用户可以免费使用MindMeld完成1000次语音搜索,之后可根据实际使用次数每月缴纳49美元(最多可进行1万次语音搜索)到1999美元(最多可进行80万次语音搜索)不等。
Tuttle相信,到今年年底,移动设备上附带语音识别技术的应用占比将增长到40%。他认为三年后语音技术将会是我们所用设备的客户界面里最基本的配置。他表示:“我们现如今还处于语音技术探索的初级阶段。但也许只需要再过5?10年的时间我们就能研发出《钢铁侠》中Tony Stark用的声控电脑Jarvis那样的产品。”
更多的杰出科技
Asus Chromebit可以通过HDMI接口与任何一个显示器或者电视连接,如果再接入蓝牙键盘和鼠标,就可以成为一台内置2GB内存和16GB固态硬盘、带有一个USB接口、具备Wi-Fi功能的Chromebook迷你电脑。
Saygus V2是一款超级智能手机,能够将影像通过无线HD传输技术同步至大屏幕显示,可无线充电,拥有Harmon Kardon 3D立体声、2100万像素摄像头及320GB容量,同时手机已进行防水处理。
将Panono的球型全景摄像机抛向天空,你可以通过Panono的APP看到拍好的360度无死角照片。
瑞典的Penclic设计了一款符合人体工学的鼠标,鼠标无论从外观、感受还是使用上都像钢笔一样。
虽然Apple Watch看上去很酷,但是它需要一台iPhone才能工作。而Spur的Atomic智能手表能够直接通过Google Play下载应用满足用户的基础需要——通话、发信息、发邮件、浏览社交媒体,而不需要有一台智能手机在旁边。
Biomeme可以将iPhone变成一个诊断工具。它能够针对多种疾病快速检验血液、尿液和粪便样本,同时还能够检测犯罪现场的DNA。它甚至已经可以对埃博拉病毒进行检测。
Loopwheels重新设计的车轮采用了碳素弹簧钢悬架装置。新的车轮减轻了震动,吸收了路面颠簸带来的冲击,为轮椅和自行车使用者带来更轻便、更平滑的体验。
通过蓝牙技术,Ilumi LED灯泡的使用者可以调整灯光颜色和亮度,设置灯光定时开关,让灯光随音乐同步变幻,并且可以根据自己的作息时间进行智能调节。
堪称“无人机中心站”的Airware的航空信息平台Aerial Information Platform拥有操控一队无人机所需要的一切条件。人们在采用Windows系统的笔记本或者平板电脑上就可以正常控制。平台会保证无人机按照联邦航空局的规定航行。