Autonomy非结构化数据处理优势显现

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:wlhlesley
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在结构化数据处理变得越来越重要的今天,在非结构化处理方面具有显著优势的HP Autonomy的价值逐渐凸显。在惠普推出的新一代大数据平台HAVEn中,Autonomy新一代信息平台HP IDOL扮演着非常重要的角色。
  惠普对Autonomy的收购曾经饱受争议,但是不能否认的是,HP Autonomy在惠普大数据战略中的地位越来越重要。在7月4日举办的媒体沟通会上,惠普软件集团Autonomy信息分析部副总裁兼总经理Rohit De Suaza和惠普中国区副总裁、惠普软件集团大中华区总经理于志伟详细介绍了Autonomy HP IDOL在惠普大数据战略中的重要意义和最新进展。
  大数据下的机会与风险
  这是一个不能不重视大数据的时代。于志伟认为,大数据蕴含着机会,也蕴含着风险,企业即便不能利用大数据来提升竞争力,也要避免因为没有处理好大数据而蒙受损失。
  加拿大歌手Dave Carroll乘坐美联航航班从加拿大哈利法克斯前往美国内布拉斯加时,他那名贵的吉他在托运过程中被美联航的行李运输工摔坏。历经九个月后,Carroll索赔未果。无奈之下,Carroll制作了一首名为《美联航摔坏吉他》的音乐视频并上传到Youtube上。没想到这个视频在短短10天内就获得了近400万人次的点击量,成了互联网上最红的视频之一。美联航为此付出了惨痛的代价——股价暴跌10%,还被数以百万计的人指责。在这个时候,美联航不得不乖乖地给Carroll赔偿。
  “我们都了解大数据很重要,但是很多企业都不知道怎么有效利用大数据。”于志伟以这个知名的大数据案例来说明大数据给企业带来的挑战。他同时通过这个案例指出,非结构化数据将变得越来越重要,对企业决策产生的影响越来越大。
  处理非结构化数据优势显著
  正是在这一背景下,各大软件厂商都推出了大数据平台或者大数据解决方案,以免错过当前的大数据发展良机。
  为了强化大数据战略,惠普于去年推出了新一代大数据平台HAVEn。据了解,HAVEn平台实际上是一个惠普大数据产品的组合,它整合了HP Autonomy、HP Vertica、HP ArcSight 和惠普运营管理的技术和产品,还支持Hadoop等。
  于志伟认为,HAVEn具有两大特性:一是开放性,二是能够处理100%的信息,其中包括结构化数据、非结构化数据和半结构化数据。其中,在处理非结构化数据和半结构化数据方面具有很大优势的HP Autonomy 发挥了非常重要的作用,其代表产品是新一代信息平台HP IDOL。
  Rohit De Suaza强调,HP IDOL可以直接输入和分析任何类型的数据,包括社交媒体、电子邮件、视频、音频、文本和网页等,而且这些资料可以来自任何系统,如微信、微博和传统的企业应用系统等,而其他厂商则需要将这些数据移动到数据仓库后才能进行分析。
  “在信息爆炸式增长的时代,如果要把海量数据移来移去后才能发现其价值,成本和难度就会大幅增加。”谈到HP IDOL的优势,Rohit De Suaza指出,HP Autonomy具有专有技术,只要拥有访问权,只需通过连接器就可以连接到400到500个系统中去进行分析。
  循序渐进推进大数据应用
  “如果公司想一下子就对所有信息进行大数据分析,那注定是要失败的。”Rohit De Suaza认为,企业部署大数据不能一蹴而就,而是要一步一步行动,逐渐完善。他建议,企业应该从充分挖掘之前没有好好利用的数据的价值开始做起,逐渐扩大数据范围。
  比如说,汽车厂商可以通过挖掘社交媒体上的信息发现刹车片等存在的问题,提前两三个月行动召回相关的产品,就能避免很多损失。
  Rohit De Suaza补充说,对于企业来说大数据只会变得越来越重要,涵盖的环节会越来越多,因此企业在选择大数据平台时,应该注意到这个平台能否涵盖大数据应用的各个环节,以满足企业未来的大数据应用需求。Rohit De Suaza指出,惠普可以从技术到软硬件产品,再到服务,全方位帮助企业不断完善大数据战略。
  最近惠普还推出了下一代服务IDOL On Demand,这样开发人员就可以将先进的处理功能嵌入到企业的应用系统中,并通过预览查看服务效果。
  进一步强化非结构化数据分析
  值得一提的是,惠普近日推出了IDOL的新版本IDOL 10.5。IDOL 10.5强化了与HP HAVEn大数据平台的关键组件的集成,其中包括HP ArcSight、HP Vertica和Apache Hadoop等,大幅提升了HP IDOL的分析能力、可靠性和易用性:
  第一,可靠性提高。HP IDOL 10.5更加稳健可靠,比如,具备更好的资源管理与检测功能,可实现系统从故障中智能地恢复等。
  第二,具有更高的可管理性。HP IDOL 10.5改进了HP IDOL Admin控制台,大幅简化了映像服务器接口,支持异步查询支持,改进了压缩机制,通过差异化备份与时间点恢复带来更灵活的备份体验。
  第三,具有更优越的能力。这主要体现在针对关键云应用软件和系统的新接口、通过精确的情感评分改进情感分析、针对具体业务使用案例的全新预定义实体、强化的音频和图片分析、更高的查询性能,以及动态结构化数据分析(允许虚拟分析域的移动中定义)等。
  来自惠普的资料称,HP IDOL与HP HAVEn的主要组件集成使得不同规模的企业都能利用大数据来获得竞争优势。其中HP IDOL for Hadoop在某种程度上把Hadoop从传统数据存储仓库变成强大的智能分析平台,从而让用户从PB级的数据中获得洞察。该产品通过把HP IDOL强大的情感分析、集群和实体抽取等功能嵌入Hadoop节点,进行先进的客户、安全、运营分析等。
  链接 Autonomy部分应用案例
  阿富汗安防应用
  在阿富汗某个比较敏感的地区,有关部门在离地面约1.6米高的气球上安装了摄像头,并借助IDOL分析画面来找出异常现象。2012年的平安夜,系统在发现有两辆车先后沿着公路开到同一位置转向绕行离开后,自动发出警告。后来有关部门派人去现场调查后,果然发现恐怖分子在公路上埋了炸弹,绕行的是当地车辆,因为当地人知道恐怖分子的行动。HP Autonomy的视频分析因此避免了恐怖分子攻击带来的死伤。
  美国纳斯卡汽车赛事互动
  非常受欢迎的美国纳斯卡汽车赛,主办方非常关注粉丝的情感变化。主办方会在一个中心实时监测所有粉丝发布的涉及纳斯卡赛事的推文。在一次赛事中,因为发生了撞车事件,导致所有电视停止直播。当时很多粉丝看不到直播,发推文表示不满。而现场的一些粉丝通过手机上传视频到推特上受到追捧。主办方通过系统及时发现故障,并快速恢复直播。
  自动聚合新闻网站
  内容丰富且类别清晰,全球热点新闻一个不落的新闻网站,却不需要任何一个编辑、记者?是的,这个无人值守的网站的服务器位于英国剑桥,内容由HP Autonomy通过抓取各大新闻网站信息自动聚合而成。据悉,HP Autonomy可以聚合各种语言的新闻网站。
其他文献
对于现在的用友公司来说,机遇与挑战并存:一方面,新技术浪潮正冲击着其在我国管理软件市场原有的龙头地位,转型迫在眉睫;另一方面,信息消费正带来巨大的市场机遇。  2月20日,在由赛迪顾问股份有限公司主办、主题“信息助力消费、数据提升价值”的2014中国IT市场年会上,用友公司高级副总裁郑雨林在接受本报记者专访时详细阐述了信息消费给用友公司带来的机遇与挑战。  郑雨林认为,信息消费可以分为两条线,一条
本报讯 近日,国务院办公厅转发了中央机构编制委员会办公室、国家质量监督检验检疫总局《关于整合检验检测认证机构的实施意见》(以下简称《意见》),以推动检验检测认证高技术服务业做强做大。  《意见》指出,随着社会主义市场经济的不断发展,对检验检测认证的需求日益增长,检验检测认证服务呈现出良好发展势头。但我国检验检测认证机构尚处于发展初期,缺乏政府统一有效的监管,规模普遍偏小,布局结构分散,重复建设严重
2014年巴西世界杯赛场上的每一粒进球都牵动着数亿中国球迷的心。对新闻媒体来说,最重要的就是及时发掘热点话题引起球迷的讨论。通过IBM社交大数据分析系统的深度挖掘,腾讯得以把握世界杯期间每个阶段的热点。  2014年巴西世界杯已经渐渐离我们远去了,但中国球迷仍然在社交媒体上谈论着各种感兴趣的话题。虽然中国队没能参加本届世界杯,但是这似乎丝毫没有影响中国球迷的热情——他们通过社交平台和工具发出自己的
2012年,从做开源Linux软件起步,到全年收入突破10亿美元大关,红帽公司迈入了一个全新的发展阶段。从专注于Linux操作系统,到今天拥有包括操作系统、中间件、虚拟化、存储和云计算在内的五大产品线,红帽公司已经可以为行业客户提供完整的云计算解决方案。坚定地沿着开放道路前行的红帽公司又瞄准了新的目标——开放混合云。  水到渠成  李树翀:在美国《福布斯》杂志公布的2012年全球最佳创新公司排行榜
百度大数据引擎的开放策略将试图吸引传统企业将数据输入到引擎中从而挖掘数据中的价值,同时,大数据引擎也将加速传统企业的互联网化。  在近日召开的百度第四届技术开放日(下文简称开放日)上,百度首次公开了其大数据引擎的技术和细节,并称将百度的大数据能力开放给公众,这格外引入注目。  “互联网正在改变传统产业,而技术——特别是大数据技术正在改变互联网。”百度董事长兼CEO李彦宏在开放日上的致辞,不仅燃起了
本报讯 近日,锐捷网络发布了第二代PowerEG出口网关产品,该产品具有初始化自动导入,“0”配置上线的特点。通过在总分型企业中采用双边部署后的实地测试,用户打开同一网页的时间从20秒减少到1秒。  在上一代产品功能基础上,PowerEG还从业务系统部署、业务系统开展使用、持续维护与优化三个方面,对业务系统提供了更全面的支撑与提升。通过使用PowerEG的零配置上线解决方案,分支机构网关只需插入初
针对2013年—2014年的企业安全威胁问题,趋势科技进行了一项调查。调查结果显示,在各种入侵企业内部IT系统的行为中,物理化的攻击正在减少,取而代之的是利用恶意软件进行入侵。而且,基于这种“更有效”方法的入侵行为,不仅频次正在持续飙升,精准度也在提高。根据该项调查,99%的恶意软件最终只感染了不到10个受害者,而80%的恶意软件只感染了一个受害者,就达到了入侵的目的。显然,以企业内部系统为目标的
步入大数据时代,中国存储厂商的创新激情再次被点燃。围绕着企业级用户的数据存储、管理、备份、使用以及安全等需求,北京赛思信安技术有限公司(以下简称赛思信安)进行了全面的产品研发。4月11日,赛思信安在北京展示了其最新的研发成果,共五个系列数十款新品,涉及存储优化、大数据管理、数据安全与存储管理、通用存储、高性能计算等五个领域。  数据消冗 提高效率  赛思信安成立于2007年,一直致力于存储产品的自
在日常办公中,随着人们需要处理的数据越来越多,人们对办公设备的要求也越来越高,尤其是在安全性、输出速度、移动等方面。  近日,为了满足人们对办公设备越来越高的要求,佳能发布了4个系列的新品,包括A3幅面中速复合机iR-ADV4200系列,A4幅面高速数码复合机iR-ADV400/500系列,A4幅面入门级黑白激光打印机LBP8750n/8780x,A3幅面高速黑白激光打印机LBP6018w/601
“2011年,几乎所有的数据泄露事件都有Web攻击的影子。在新的一年里,移动技术,社交网络和云计算技术会进一步被广泛采纳并迎来爆炸式发展,人们很快就会看到恶意分子利用这一变化。在新的一年,黑客针对企业和政府的攻击将不再是多么复杂的代码,可能仅是诱使员工完成一个轻轻的点击就能实现。”日前,Websense安全实验室专家对2012年网络安全状况进行了预测,提出了七项关于应对数据泄露及网络攻击的建议。