百度的技术突破与应用

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:loseunit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  人工智能技术是当前互联网领域技术发展的最前沿,被认为是互联网产业的下一个“引爆点”。百度作为国际上最早将深度学习上升为战略技术方向的四家公司之一,很早就在人工智能领域加大投资,展开布局。从2013年成立深度学习研究院,到2014年成立百度研究院,并将世界三大人工智能专家之一、前“谷歌大脑”之父吴恩达招致麾下,出任百度首席科学家,统率北京与硅谷两地团队共同展开前瞻性研究,打造世界顶级人工智能研究团队。过去两年内,百度在人工智能领域展开多项研究,取得了包括语音识别、图像识别等在内的显著成果,并积极探索无人驾驶等前沿技术领域,持续引发业界关注。
  在人工智能领域,存在着这样一个正循环:通过人工智能技术不断优化产品,让优秀产品吸引更多用户,更多用户产生更多数据,而更多的数据可以使人工智能的性能得到提升,从而让产品更优秀。然而在过去数年里,人工智能算法遭遇瓶颈,更多的数据并没有让人工智能性能得到明显提升,而百度应用深度学习技术和算法,推动了这个正循环运转加速,并通过不断实践和创新实现人工智能技术的突破。
  2014年4月,在第四届百度技术开放日上,百度推出大数据引擎,包含开放云、数据工厂、百度大脑三大组件。而百度大脑则是基于大规模机器学习、深度学习技术,通过计算机模拟人脑神经网络,通过多层的学习模型和海量的训练数据来完成数据智能,让用户能够与机器进行自然的交互(如通过声音、图像和OCR等方式),让机器更好地理解用户的需求,完成信息与需求的精准匹配。百度大脑的深度神经网络拥有200亿个参数,其参数复杂度几乎超过现存的任何多媒体领域用到的数学模型,能够处理的特征向量数目上千亿。另外,通过自主研发的GPU并行计算平台,提升DNN训练效果,突破深度学习算法并行化难题。
  百度在人工智能领域的实践最初来自于搜索引擎所遇到的挑战。数据显示,过去一年在百度上寻找服务的请求增加了133%,随着用户需求更趋于复杂化和个性化,从最初的获取信息,到现阶段希望能够通过搜索引擎直接获取答案、连接服务,需要利用人工智能技术实现人和服务的精准匹配。另外,用户也更趋向于基于自然的交互方式。据统计,现阶段在百度的搜索请求中10%是以语音的形式来表达的,而未来5年使用语音和图像来表达需求的比例将超过50%。基于如此真实强大的需求,为了不断提升用户体验,百度首先在图像识别和语音识别这两项前沿技术领域实现突破,并取得了一系列领先成果。
  2012年11月,百度上线了基于DNN的汉语语音搜索系统,成为最早采用DNN技术进行商业语音服务的公司之一。目前,百度已经积累了数万小时的声学训练语料和海量文本语料,线上语言模型总量超过100G,支持小时级别的海量语言模型更新。语音识别DNN网络深达九层,基于听觉感知的深度学习声学建模技术可以实现更高的精准度和识别率。在安静情况下,百度的普通话识别率已达到95%以上,处于国际领先水平。百度语音对内支持了手机百度、百度输入法、百度地图、百度导航等一系列产品,同时基于开放平台,提供多个垂直领域的识别和解析服务,合作伙伴超30个,覆盖汽车、医疗、手机、电商、家电和车载等十几个方向。
  在图像识别领域,百度在2012年底将深度学习技术成功应用于OCR识别和人脸识别,并推出相应的PC和移动搜索产品;2013年,深度学习模型被成功应用于一般图片的识别和理解。目前百度的人脸识别准确率超过98%,处于国际领先水平,图像识别技术已经用于手机百度、百度识图等多个APP中。从百度的经验来看,深度学习应用于图像识别不但大大提升了准确性,而且避免了人工特征抽取的时间消耗,从而大大提高了在线计算效率。目前利用CNN(卷积神经网络)和RNN(递归神经网络)技术,百度成功地实现将图像内容生成自然语言的描述性句子或段落,从而在高层语义层面建立了图像和自然语言之间的桥梁,也就是“机器读图”,而这可以说是人工智能领域的一次技术飞跃。
  在大数据领域,百度基于海量的搜索数据和外部行业数据,以大规模机器学习技术为基础,能够实现简单的推理决策。现在已经成功地实现大数据预测和智能分析等技术,包括经济指数预测、景点和城市预测、疾病预测、高考预测等多个应用。2014年7月份,百度在世界杯预测方面战胜了谷歌、微软、高盛、雅虎等世界著名高科技企业,同时利用其先进的技术和资源,于2014年9月推出百度预测开放平台,对外提供平台化预测服务,辅助企业利用大数据进行商业决策。
  除此之外,基于深厚的技术积累,百度也积极在更多前沿领域展开探索。比如今年在百度世界大会上发布的智能可穿戴设备BaiduEye,就是基于自然的人机交互技术,通过对佩戴者的视觉信息进行图像分析,结合百度强大的大数据分析能力和人工智能技术,为用户提供所见事物背后的信息与相关服务,帮助人们更好地了解周围世界、获取信息、连接服务。在世界顶级互联网公司角逐的无人驾驶领域,百度也积极布局。2014年9月15日,百度与宝马正式签署合作协议,共同致力于在中国推进高度自动化驾驶技术的研究。双方计划未来将联手攻克高度自动化驾驶在中国道路环境下面临的技术挑战,通过智能技术加强道路行驶安全性,减少交通事故与人员伤亡。
  在2014年11月的世界互联网大会上,百度公司创始人、董事长兼CEO李彦宏表示百度正在持续投入大笔资金用于人工智能的研究,“我们需要有这种信心,甚至对我来讲是一种信仰:就是对于技术的投资会获得回报,而且不仅仅是给百度带来回报,更会给整个社会带来非常大的回报”。作为一家有着深厚技术基因的公司,百度一直在引领着互联网的创新,正如美国知名高科技网站Xconomay所评论的,百度正在成长为全球人工智能领域的领袖型企业之一。而未来我们可以期待百度加速实现人工智能领域的正循环,推动互联网的发展,进而通过技术改变世界。
其他文献
基于IP的门禁控制具有以下益处:简化的系统操作、扩展与定制;在同一网络中将物理门禁系统集成于多个其他解决方案的能力。门禁系统智能化之后能够简化系统监控、管理与报告的流程。  为实现电子门禁控制系统更高的安全性与多系统集成能力,许多机构转向采用信息化的电子门禁控制系统,电子锁信息化解决方案的需求量也随之出现增长。而用户唯有加快采用基于IP的门禁控制系统和便捷的无线解决方案,才将最终加速这一趋势的发展
康博嘉信息科技(北京)有限公司成立于2005年,是新加坡ALOGO 基金在中国投资的高科技企业。公司已通过CMMI3和ISO9001认证。目前在北京、上海、武汉、广州、成都设有分公司及办事处。公司拥有来自新加坡和中国的技术和管理团队,十年来致力于中新之间医疗信息化建设技术交流和经验分享。在私立高端医院一体化信息解决方案的提供、临床应用系统的开发和医疗移动系统的应用等领域取得了丰硕成果。  伴随医疗
9月16日,全球著名的综合布线领导厂商美国西蒙公司在北京隆重召开首席技术官和运营副总裁John Siemon媒体见面会暨ConvergeIT智能建筑结构化布线解决方案推广会。  ConvergeIT实现低碳环保  美国西蒙公司成立于1903年,至今已有111年的历史,专门提供高品质、高性能的弱电基础设施解决方案和服务,同时还提供全面的铜缆和光纤布线系统、机柜、机架、线缆管理、数据中心供电和制冷系统
主管单位:中华人民共和国工业和信息化部  主办单位:中国电子信息产业发展研究院   北京赛迪新知文化传播有限公司  社长/总编辑:刘静平  副社长: 刘寻 张忠文  副总编辑: 陈翔 王沛霖 马文方  前 台: 88559778 88558362  办公室: 88559707 [email protected]  广告部: 88559066 zhangzhongwen@ccidm
InfoComm China 2014是有史以来规模最大的一届,占满了国家会议中心所有6个展馆及会议厅,展览面积达到4.5万平方米,比上一届增加了将近30%。InfoComm China 2014有来自12个国家和地区的共249家参展商参展,全球领先的厂商悉数到场,使得InfoComm China 2014成为当今亚太地区规模最大和国际性最强的专业视听技术和集成系统展览会。  InfoComm C
“今天天气怎么样?”  “北京今天晴,温度-15℃~-5℃,北风3~4级。”  无论是打电话、发短信、搜索应用,还是查找周边信息,只要你打开语音助手应用,点击话筒,说出需要寻找的信息,不必亲自打开各种应用程序并且手工输入,你就可以轻松实现信息搜索。语音搜索让人机交互变得更加顺畅和便捷。  苹果发布的Siri语音助手让语音识别应用风靡全球。浏览器内嵌语音搜索已经成为标准配置,应用商店中的类Siri应
UC浏览器总经理朱挺说,手机浏览器绝不止是一个工具,更是一座人与信息连接的桥梁。如今,基于大数据技术的UC浏览器,正通过构建个性化信息精准推荐平台来实现信息连接方式的重构,并以此挑战搜索引擎等其他信息服务工具。  在一个人没买房前,他一打开浏览器,导航页上最好的位置呈现的都是房产资讯;当这个人买房后,他再打开浏览器,发现导航页上的最好位置换成了装修市场的资讯;当这个人装修完毕后,他又打开了浏览器,
8月17日,由上海国家会计学院与浪潮集团联合主办,CIMA协办的“‘互联网 企业’ 赢在数字化转型”高峰论坛在上海举行。论坛期间,浪潮集团与上海国家会计学院签署战略合作协议,旨在优势互补,共同探寻“互联网 ”背景下支撑企业数字化转型最佳的财务管理解决方案。  关注财务与大数据的融合  上海国家会计学院院长李扣庆在演讲中指出,“互联网 ”的核心价值在于更广泛、便捷的连接和基于连接的共享,这为企业更好
深圳市能士信息安全有限公司成立于2003年,注册资本3400万元。是一家以信息安全和物联网双要素驱动,具有独特发展理念的专业信息技术公司。具有涉密、研发、密码、服务、集成等各类国家级资质。  政治上可靠,技术上过硬  深圳能士先后获得《涉及国家秘密的计算机信息系统集成资质》和《保密技术防护专用系统研发生产指点单位》资格,是国家保密局直接管理的双重涉密单位。在中国共产党第十八次全国代表大会期间,深圳
梁启超在《少年中国说》中曾写道:“今日之责任,不在他人,而全在我少年。少年智则国智,少年富则国富,少年强则国强。”在“万众创新”的大背景下,创新人才的培养成为了重中之重,这其中又以培养年轻人尤其是青少年的创新能力最重要。作为国内持续时间最长的计算机赛事——中国儿童青少年威盛中国芯HTC计算机表演赛,正是在这样的氛围下召开的,本次赛事参赛的作品最突出的特色就是与当下热门IT相结合。  今年的中国儿童