腾云天下:无数据不AI,无人工不智能

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:pandawang1231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  今年又出现了很多热词,不止大数据,人工智能(AI)、深度学习、机器学习、AR、VR……形形色色的创业团队鲸吞了市场上相当一大部分的投资。所有这一切好像跟我们相关,但又好像离商业价值那么远,他们到底跟数据有什么关系,有没有可能给其他行业创造价值?
  新时代的到来
  后数据爆炸时代
  其实整个人类的发展历史,就是人类不断尝试记录、测量自身和世界的过程。无论从古时候人类发明算盘、阿拉伯数字,又到近代发明二进制计算机,都像是这一现象的反映,而人类对自己,包括对世界的认知还是那么浅。比如描述一个人时还只能说这人是男是女,是老是少,身高、体重等;提到环境时会说气温怎么样、湿度怎么样……但人类对于数据测量的需求一直没有减弱。
  根据TalkingData的数据统计,目前在中国,智能手机(含平板电脑)有13.05亿用户,智能手表等可穿戴设备已经达到千万级,这意味着什么?智能手机、智能设备基本上人手一部甚至更多,而每部智能手机平均携带多达16种的传感器,每天产生1G数据。这不仅加强了人类感知和数字化世界的能力,也让数据以前所未有的速度在产生和发展。所有这一切现象,都揭示了以人为中心的世界正在加速数字化。这是一个数据爆发的时代。
  人工智能:已经过了单纯积累数据量的时代
  移动设备已经成为人类身体的延伸。根据TalkingData的数据统计,我们每天使用手机将近四个小时。不管是上网,还是在现实生活中,在家、上班、吃饭、旅游、消费……我们所有的足迹都被默默地记录了下来。数据行业迎来了历史上最好的时刻——数据爆发的时刻。
  但这已不是一个单纯的积累数据量的时代,新的时代对计算提出了更高的挑战。
  第一, 这些数据并不是所有的都被存储和收集。大量隐形数据的采集、运算、存储、传输等领域依然存在着巨大的障碍。
  第二, 如何从大量的数据里面解读人的动作、识别人的场景是更重要的问题。现在很多数据都是非结构化的情境数据,例如图像、声音、姿态、动作,需要人工智能的帮忙从中提炼有价值的信息。世界上顶尖的技术公司都在尝试用算法、机器学习去还原人在现实生活中的动作,不管视觉、听觉、姿态、感知还是做一些基础的工作,现在语音、图像识别技术都在大规模发展,但是为什么当数十亿大脑神经元彼此传递信号时,就会出现喜爱、恐惧或愤怒的主观感受呢?对此,我们依然一无所知。人工智能对世界的认知还停留在早期阶段。
  数据促进了人工智能的发展。AI过去与现在的最大区别是,必须具备的计算能力、原始数据和处理速度现在都有了,因此AI技术现在能大放异彩。目前人工智能在识别(包括认知)产生很大进展的原因首先是数据量带来的。谷歌在语音识别领域取得了很大的突破,但这背后的原因是谷歌建立了几十亿音频的库,而且用人类的智慧标注它,所以可以用算法、人工智能找到模式,甚至可以区别不同口音。图像也是如此:过去几十年里,人类花了大量时间去标注这些图像,我们才能在图像里面切割识别出各种各样的物体。没有这些人的智慧现在人工智能达不到这样的程度。
  人的智慧:AlphaGo背后的故事
  以AlphaGo人工智能为代表的AI复兴体现对于世界的认知能力正在加强。在过去的几年间,我们看到,机器学习、强大的算法、强大的处理能力和所谓的“大数据”已可以让机器做一些让人印象深刻的事,比如:实时语言翻译、在复杂的城市环境中安全地开车。
  AlphaGo战胜人类被视为AI历史上的里程碑事件。大家看到AlphaGo战胜了李世石,但是不知道背后的故事。TalkingData的CEO崔晓波作为亲历者之一(这场棋赛的解说者),看事情的角度和大家不同,他看到了数据的力量。
  他认为,在这场比赛中,关键的获胜因素有两个:
  第一,要有足够的数据支撑。AI要模拟人,它首先要知道人在面对不同事情的时候是怎么去把握的,而这种判断和把握的能力就是出自于成千上万的海量数据得出的结果。
  AlphaGo拥有一个数据库,里面有十几万份人类6~9段职业棋手的对弈棋谱。Alphago从中模仿人类常见的落子方式,根据谷歌透露的数据,模仿的准确率达到了57%。也就是说,单单这一项功能,就可使AlphaGo在一步的选择上有57%的概率与人类高等级职业棋手相同。2014年,Google来到中国棋院买棋谱,近两年累计记录的棋谱数量是过去几百年的总和:根据KGS统计,KGS平台每年专业段位的对局棋谱的累积量,近三年研究的棋谱数量都接近20万。GoGoD平台的累积大约8.5万专业段位棋谱。18万的棋谱共有近2500万的局面,每一局面都可上下左右、镜面翻转,这个2500万局面就能再乘以8,这个数据量已经能够支撑深度学习。
  第二,要有人类的智慧。AlphaGo在下棋的时候“聪明”得像一个人,大量的数据提供了它“思考”的来源。但AI不是由大数据一手决定的,还有人的经验和智慧。AI会发展成什么样?打个比方:大数据是土壤和养分,AI是植物,而人就是园丁。土壤和养分让植物长得好,但也离不开人的修剪和培养。替AlphaGo持棋跟李世石对战的那个人本身就是六段的高手,他在训练AlphaGo时,加入了大量的人工智慧和人为规则,这些都是被人忽略的。我们过大强调AI的作用,更现实的还是要引入专家的智能、人的智慧,在数据科学和数据工程不断完善的情况下,提高AI的水平。
  虽然AI应用能使一些任务变得自动化,但人类判断全部交由算法负责几乎不可能发生。更现实的方法是,使用数据科学和工程不断完善并提升人类的判断质量。当数据十分充足,依靠统计学的方法进行决策是恰当且合理的。当没有数据或拥有的数据十分有限时,采用群体智慧和其他心理学方法能够更好地进行决策。“智能”数据应用将把日程工作自动化,从而空出更多时间让人类专家专注于需要他们专业判断的工作,以及从事社会认知和共情等非认识能力的行动。比如:保险公司可以使用深度学习系统,将估算受损汽车的成本修理费用变得自动化。但在可以预见的未来,人类仍将是“决策过程中的一部分”。   数据为本,AI为核心,人为关键
  这个时代叫做智能数据时代
  智能数据,不同于传统的数据,就是添加了人工智能和人的智慧的数据,这个名词的出现,揭示了数据、人和机器三者之间的有机联系。这种有机联系赋予数据更多价值,赋予数据心智。现阶段数据内容包含的信息量越来越大、维度越来越多,从图像、声音等富媒体数据,逐渐过渡到人的动作、姿态、行为轨迹,再加上地理位置、天气、社会群体行为等,按照以往处理数据的思路已经难以适应“数据”本身发展的速度。一个融合人类智慧、人工智能和海量非结构化数据的智能数据时代已经来临。因此,“发展多年的‘大数据’即将进入‘下半场’”。
  这个时代最重要的三个要素是:数据、AI,人的智慧。做个比喻,数据相当人的血液,人工智能相当于人的心脏,心脏需要血液,同时把血液输送给全身,如此往复循环。人的智慧是什么?大脑是不可替代的。所有这一切构成了智能时代的三个要素。
  数据时代的颠覆和挑战
  未来,数据行业本身将会面临进一步的洗牌,能够更好地应用异构的、情境化的数据,能够开发更加智能的算法,能够开源撬动生态价值流动的企业会获取更大的竞争优势,也就是说,能够驾驭智能数据的企业得天下。这样,竞争优势会内生叠加,进一步帮助企业吸引更多的人才和技术;人才和技术持续集中,根据数据分布的特点,中小型企业将被迫向垂直数据应用领域转型,并稳定在垂直领域,但同时又不得不依托于大型生态的数据连接能力,最终呈现一种“一大多小”两极分化、“小依附大”的竞争态势。
  对于其他行业来说,企业将面临四个方面的挑战。1)业务数据化:所有业务都以数据的形式进行流转。2)数据资产化:在很多企业,业务与运营没有形成闭环;数据没有资产化,只是先储存起来而已。智能数据时代,会倒过来,业务可能不赚钱,但数据将体现出商业价值。3)应用场景化:企业与用户的每一个交互点,都具有改变用户认知的功能,因此场景化将成为营销的核心。4)技术开源化。智能数据首先会颠覆那些比较依赖于快速决策的高频交易行业,比如高新技术企业、零售、广告……还有为这些行业提供决策支撑服务的专业企业、代理商、咨询服务商等。紧接着,传统行业的各个环节也会受到极大颠覆,出现新的销售渠道和获客手段,极大地更新行业平均效率。
  智能数据时代的新商业范式:新贝叶斯定律
  智能数据时代,数据离所有企业的商业价值都很近。在交流过程中,基本上客户只问一类问题:好像大数据这个系统投入很大,到底有没有价值,到底怎么产生商业价值,商业价值又体现在哪些方面?这类问题的终极答案会在这个时代得到揭示。一个新的商业范式诞生了,TalkingData称之为“新贝叶斯定律”。
  贝叶斯定律是大数据时代重要的定律,无处不在,所有的机器学习算法、图像识别、语音识别,一切统计方程式后面都是这个定律在起作用,大数据满足了修正到最接近现实的基础条件——数据量的积累。在此基础上,与传统统计学不同的是,贝叶斯定律集合了人的智慧,在决策的过程中,我们能够不断修正,更快地做出正确的决策。比如说炮兵在瞄准目标时,先根据自己的经验试射,在首发不中的情况下,马上根据炮弹的落点修正,这样三到五次就可以命中目标了,这种瞄准的方法就是贝叶斯定律,强调的是首先靠人的智慧,来确定一种方案,做一个决定,后续不断地通过吸收数据来调整方案;数据量越大最后越能得到一个接近现实的结果。
  可以看到,贝叶斯定律所强调的跟TalkingData提出智能数据时代的三个要素不谋而合:人基于数据去训练AI,能得到一个非常有价值的东西。在智能数据时代,企业的商业价值会和基于数据的人工智能的发展,以及不断提高的基于数据人的智慧,呈正相关关系。总结来说,数据本没有意义,AI本没有智慧,是人,让其有了意义,有了智慧;无数据不AI,无人工不智能。
  TalkingData精耕于数据,在智能数据时代深谙新商业范式的精髓。作为新智能时代的数据生态的知名公司,腾云天下将全球的海量数据、先进技术和顶级的专家完美地融合在一起,帮助各个企业迎接全新时代的到来。
其他文献
2016年10月20日,第一届中国人工智能技术与应用大会暨人工智能60周年颁奖典礼闭幕,由武汉嫦娥医学抗衰机器人股份有限公司(以下简称嫦娥抗衰股份)送审的“嫦美皮肤解码机器人”人工智能产品系列斩获本届大会“2016年中国人工智能卓越技术奖”、“2016年中国人工智能创新产品奖”、“2016年中国人工智能优秀产品奖”三项大奖。该系列皮肤解码机器人作为医学抗衰领域智能化产品新的品类走入大众的视野。  
全国工商联汽车经销商商会(以下简称“汽商会”)前不久公布的数据显示,今年上半年约有90%的经销商处于亏损状态。截至7月28日,本年内又有42家4S店轰然倒闭。汽商会秘书长朱孔源预计,未来全国30%的经销商有可能会倒闭。  汽车行业低估了经济新常态对自身的波及与深远影响,汽车经销商盈利能力持续下滑,汽车流通环节将不会再能够轻松盈利,也不会再有坐等客户上门加价的情况。2015年各品牌实施的降价促销市场
互联网正以迅雷不及掩耳之势与各行业“互联互通”,成为各国抢占制造业竞争制高点的一柄“利剑”。  “工业4.0”的概念源于2011年德国汉诺威工业博览会,其初衷是通过应用物联网、“务(服务)联网”等新技术提高德国制造业水平。它通过信息物理系统(CPS)将资源、信息、物体和人紧密联系在一起,构成一个智能生产网络,从而实现纵向(企业内部)、横向(企业之间)和端对端(整个价值链)的高度集成,将实体物理世界
辣妈帮目前掌握的数据,包括用户基础数据、行为数据、兴趣数据、能力数据等。围绕用户整体数据,辣妈帮会定期进行分析,借助数据分析结果,实现了知识、帖子、广告的精准推送和关联内容推荐等功能。  随着辣妈帮的用户越来越多,这些用户产生的内容也会越来越多,这时如何保证妈妈们获得的内容都是精准的、有价值的?从准妈妈到妈妈,是一个不断变化的过程,辣妈帮如何跟踪妈妈用户需求的变化,并且给予满足?辣妈帮如何识别哪些
上海景同信息科技股份有限公司(以下简称景同科技)是一家以工业4.0为目标推动企业创新和高效执行的高端IT整体解决方案供应商,与世界一流的软件供应商 SAP、Oracle、Kronos、MPDV、K2等都结成了长期战略合作伙伴关系,为客户提供从前期管理咨询(设计)到系统集成(建设)到后期运营管理(运营)到长期IT服务外包等端到端的专业IT服务。目前景同公司下设5个事业部(高端应用事业部、协同应用事业
说到Fraunhofer IIS,知道的人恐怕没几个,但是说到MP3、AAC这些编解码器,相信就算不是IT从业人员知道的也不在少数。其实,Fraunhofer IIS是欧洲最大的研究机构,有2.4万名员工,每年的研发费用达20亿欧元,Fraunhofer IIS的研究方向中很重要的一部分就是音频和多媒体方面的研究项目。   “在音频和多媒体领域,我们已经拥有超过25年的经验和历史,有大约200名
2016年,惠普、赛门铁克都已经开始分拆运行。而与之相反,融合的力量似乎更加强大。今年,戴尔将完成对EMC的收购。作为云融合的安全与存储解决方案提供商,梭子鱼网络有限公司(Barracuda)当然也希望能实现1 1>2的效果。  梭子鱼公司能够成为安全与存储融合领域的那条“快鱼”吗?  融合是方向  “在过去几年中,确实有一些厂商进行了业务分拆,但同时,我们也看到更多的厂商在整合其业务。其实,从客
你知道吗,华为在关键业务计算领域曾经走过一段“弯路”。当年,华为也承担了国家重大科研项目,按照小型机的思路研发关键业务服务器。在样机已经成型的情况下,考虑到小型机被开放架构x86替代的趋势愈发明显,华为果断刹车,将费尽周折研发的小型机RAS技术移植到x86开放平台上,这就是如今名声大噪的华为KunLun开放架构小型机的雏形。  今天的KunLun在关键业务服务器领域独树一帜,扛起了开放架构小型机的
从关系型数据库到数据库云服务器Exadata,再到今天的数据库云服务,甲骨文一直在数据库市场不断创新,引领行业的发展。甲骨文认为,数据库云服务将成为其最大的云业务。  7月23日,2015年甲骨文数据库大会在北京举行。本次大会以“回顾、感恩、展望”为主题,一方面回顾甲骨文成立38年、进入中国市场28年来取得的成就,另一方面展望未来的发展趋势。  引领市场38年  谈到数据库,不能不说甲骨文;谈到甲
本报讯 2016年9月1日,由工业和信息化部指导,中国信息通信研究院、中国通信标准化协会主办,数据中心联盟承办的2016可信云大会在北京开幕。工业和信息化部总工程师张峰出席大会开幕式并致辞。  张峰在致辞中表示,云计算是近年来信息通信领域发展最迅速的产业之一,对国民经济和社会发展的战略支撑和创新引领作用正在日益凸显。目前我国云计算产业发展呈现几个可喜进展:一是产业实力不断增强,二是国际影响逐步提升