试论建设基于“SAP HANA”技术的公安大数据分析应用平台

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:slik
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要]大数据时代公安部门所掌握的各项数据越来越多,传统的结构化数据库系统面对越来越纷繁复杂的非结构化数据越来越吃力,在时效性上难以起到预期的作用,因此更高效、更便捷的SAP HANA内存数据厍运算技术应运而生,本文将试论在公安大数据分析平台引入“SAP HANA”技术的可行性和优越性,以及该技术将对公安工作产生的变化与影响。
  [关键词]公安大数据;SAP HANA;数据分析
  中图分类号:TP311.13 文献标识码:A 文章编号:1009-914X(2015)05-0141-01
  1引言
  近年来,大数据这个概念被越来越多的提及,信息大爆炸的时代已经到来,现阶段建设新的能够匹配公安业务场景的大数据系统是公安部门的迫切需求。公安工作与大数据也已然开始产生密切的联系,基于各种技术的大数据平台也在被建立起来,本文就基于“SAP HANA”技术的公安大数据分析平台做一个展望。
  2公安工作对大数据平台的需求
  公安部门掌握的数据越来越多,对于这些不同来源、不同类型、不同格式的数据,现有的公安警务数据平台无论是规模还是架构都很难适应在海量数据场景下的数据管理和分析,直接影响了公安形势预判和重大决策,因此,在现阶段建设新的能够匹配公安业务场景的大数据系统是公安部门的迫切需求。新建设的公安大数据系统,需要做到:PB级数据存储管理,多种数据类型与协议支持,高质量的数据整合,高效的数据分析能力,可管理和开放性,安全可靠,自主可控。
  3现有大数据平台的缺陷
  对于数据可以划分为两类:结构化数据和非结构化数据,非结构化数据没有统一的大小和格式,给分析和挖掘带来了很大的挑战。而现有的数据平台对非结构化的数据处理起来就非常的吃力。面对冗杂无序的庞大数据,简单的人海战术已经跟不上社会发展的步伐,因此更高效、更便捷的SAP HANA内存数据库运算技术应运而生,它的产生让数据存储、运算速度得到了极大的提高,让TB乃至PB级数据分析、处理和存储变得更加快捷稳定,也让大数据分析平台的搭建有了新的选择途径。
  4 SAP HANA技术
  HANA(High-Performance Analytic Appliance)是德国SAP软件公司开发的是一个软硬件结合体。它能够提供高性能的数据查询功能,可以直接对大量实时业务数据进行查询和分析,不需要对业务数据进行建模、聚合。
  4.1 SAP HANA技术特点
  4.1.1软件方面
  相对于Oracle等传统关系型数据库,SAP HANA内存数据库不仅在维护数据的完整性、一致性方面做到了最好,而且在传统关系型数据库并不擅长的领域——难以顾及数据处理实效要求方面实现了突破。追本溯源,之所以SAP HANA实现了对Oracle等传统关系型数据库的超越,是因为其采用了改进的数据压缩、行列式数据存储和内存计算技术。将海量数据经过高效压缩存储至HANA的大内存数据厍,提高查询和分析效率。
  数据压缩:SAP HANA采用数据字典的方法对数据进行压缩,用整数来代表相应的文本。对于数据格式相对单一的结构化数据源,这种压缩方式非常有效,数据读写速度也因此得到提升。
  行列式存储:有人曾形象的比喻,HANA可以“识别”用户在插入数据和输出数据时的真正意图。实际上这是因为HANA采用了行列式存储方式,即增量更新(插入数据)时,HANA将它视为行式数据库;而输出数据时,HANA又充分利用其列式结构适合数据压缩的优点稳定快速的输出数据。而传统关系型数据库则需要牺牲其中一种方式来保证速度。
  内存数据库计算技术:根据计算机组成原理我们知道数据是从磁盘->通过数据总线和控制器(RAID,I/O hub等)—->内存—->CPU Cache-->CPU进行数据处理(CPU寄存器)。HANA内存数据库,就是将数据放在内存中直接操作,跨过了数据总线和控制器,直接与CPU cache进行数据传输,数据读写速度比磁盘读写速度高出几个数量级,极大地提高了计算速度,缩短了时间。内存的访问速度比磁盘快1,000,000倍。传统磁盘读取是5毫秒,内存读取是5纳秒,比SSD和闪存快1000倍。虽然寄存器和Cache的读取数据的速度比内存快,但在实际的数据处理中却应用较少。
  在传统的数据库中,由于内存存储的数據有易失性,系统断电或重启后内存中的数据就会丢失,对此SAP HAHA采取后台异步进程savepoint(Data persistence)定时把内存数据存储到磁盘中,大大降低了因故障导致数据存储丢失的问题。
  4.1.2硬件方面
  SAP不仅在软件领域独树一帜,在硬件研发方面也积极创新,和多个国际硬件厂商开展了合作,开发了多款支持HANA的高性能服务器,包括DellR910、Fujitsu RX600 S6、HP DL980 G7、IBM x3850等服务器。
  4.2 SAP HANA技术应用
  正是基于对SAP HANA高性能的认同,SAP内存计算技术正在全球内广泛应用,不断的转变人们的思考、重新规划着人们的生活和工作方式。
  以亚太区第一家上线HANA技术的某快速消费品企业为例,该企业年销售额近百亿元,业务涉及生产、销售、计划、调度、物流、市场营销等多个方面,这对企业的综合管理和整体运营能力提出了很高的要求。同时,作为一个快速消费品行业企业,准确实时的数据对于企业来说非常重要,企业高管如果要对瞬息万变的市场行情做出准确的判断,就必须依据准确实时的数据进行科学决策。
  该企业在应用了HANA技术后,确实提高了数据查询、处理的能力。数据展现能力快速提高。据测试,商业智能报表快25~30倍,逻辑计算能力速度提高了约150倍,而且,越是复杂的运算,HANA的逻辑运算能力就越突出,数据实时、同步真正实现。
  5公安工作应用hana技术的可行性
  公安部门的各类信息来源(公安管控信息、社会管理信息和社会公开信息等)中,人口信息、水电煤气信息、通讯信息、网络账号、图像、声音以及视频等信息绝大部分是非结构化数据。在这个“非结构化数据时代”,主要用于管理结构化数据的传统关系型数据库受限明显,尤其是运算速度过慢被人所诟病。而采用擅长大数据运算的SAP HANA技术无疑是明智的选择。
  首先,从数据采集及存储方面来看,作为内存数据库,SAP HANA可以将庞大的公安数据,通过高效的数据压缩和行列式存储功能进行优化,存储在HANA大内存数据库中,进而为侦察员提供高效便捷的案事件信息查询功能。值得一提的是,HANA技术采用的数据压缩和行列式存储不会破坏数据原有格式,而且可还原性非常高,非常适合侦察员保留案件原始资料和数据,提高自主分析比对不同案事件的能力。其次,从分析应用来看,作为综合应用分析平台,SAP HANA依靠其高速的逻辑运算模式,可以有效支撑TB级别以上的大数据运算,将大幅提高公安整体工作效率和水平。
  综上所述,公安部门为了在“大数据时代”脱颖而出,加强信息化建设,提高公安办案水平,强化预警节点突发情况能力,不断升级服务公共决策水平,为顶层设计提供可靠依据。而以SAP HANA技术为基础数据库应用的设想,无疑是目前公安部门破解大数据难题的理想选择。
其他文献
[摘要]即时通信,由于其具有实时性、跨平台性、成本低、效率高等优点而受到广泛的使用。设计并实现一个能够处理多用户进行实时、安全的即时通信系统具有较强的现实意义。本系统设计基于JAVA的简单即时通信系统,系统采用C/S模式。  [关键词]即时通信系统;JAVA;C/S  中图分类号:TP319 文献标识码:A 文章编号:1009-914X(2015)05-0138-01  1引言  ava即时通信系
期刊
[摘要]随着无线局域网(WLAN)技术的普及和移动通讯3G业务的发展,WLAN成为网民上网的主要途径之一。WEP加密作为无线网络安全的重要防线,是网络黑客入侵无线网络的主要攻击对象。下面,笔者将介绍一种如何在Windows环境下,不使用引导光盘而直接进行无线加密WEP入侵破解,并还原无线网络WEP加密密钥的技术方法,供大家参考。  [关键词]WEP;安全机制  中图分类号:TP393 文献标识码:
期刊
[摘要]本文在简单介绍GDI和GDI+的基础上,指出GDI+在绘制动画时效率不足的劣势,并对三种不同的GDI+动画绘图方式进行了详细的阐述;最后实现了一个GDI+界面绘图程序,比较和验证了三种不同方式的绘图性能。实验表明,使用双缓冲和bitblt结合的方式,可以有效的解决直接绘制方式的闪烁问题,提高绘图效率。  [关键词]GDI+;动态绘图;双缓冲;bitblt  中图分类号:P631.84 文献
期刊
[摘要]本文以哈尔滨轻工业学校综合性实训基地的运行为例,阐述了该校综合性实训基地在对企业员工进行技能培训、承办技能大赛、培训中职学校师资技能、开展社会服务等方面的功能拓展情况以及取得的成效。  [关键词]职业教育 综合性实训基地 功能  中图分类号:D523.34 文献标识码:A 文章编号:1009-914X(2015)05-0143-01  职业学校建设的实训基地是培养高素质技能型人才的主要场所
期刊
[摘要]通过对杨柳煤矿106采区回风大巷在复杂条件下软岩巷道修复中所遇到的技术难题进行研究,结合现场实际情况,提出了喷浆+锚网喷+注浆锚索复合支护的修复措施,有效地控制了软岩巷道的变形量,确保了软岩巷道的有效使用,为今后矿井软岩巷道修复提供了可靠的技术保障。  [关键词]软岩;复合支护;变形;技术保障  中图分类号:TU7 文献标识码:A 文章编号:1009-914X(2015)05-0139-0
期刊
中图分类号:TE345 文献标识码:A 文章编号:1009-914X(2015)05-0146-01  非混相CO2開采稠油是针对油藏油层厚度薄、或埋藏深度大、或地层渗透率太低、或含油饱和度较低、亦或孔隙度较低而发展的一种有效的稠油开采方法。
期刊
[摘要]对象识别是一种与计算机视觉与图像处理密切相关的数据处理技术。它的目的是为了检测或发现数字图像或视频文件中的某一类物体对象。目前对象识别广泛地应用与计算机视觉处理领域,包括物体识别与检测、图像检索以及视频监控等。系统分为人员管理、文件操作、摄像头操作、图像预处理、圆形物体检测以及参数配置等几个主要模块。  [关键词]物体识别;图像处理  中图分类号:TP391.41 文献标识码:A 文章编号
期刊
[摘要]电力工程施工安全管理是一门科学,不断地探索管理的新思路,探寻更为先进科学的管理措施与技术,是每个电力工程企业共同追求的目标。虽然在电力工程项目中实施安全管理体系有一定的难度,但只要很好的把体系与工程项目的日常管理有机的进行结合,抓住两者的结合点,把工程项目的管理逐步向安全管理体系科学、系统的方向转变,便能逐渐体会到体系的优势和促进作用。  [关键词]电力工程;项目管理;安全管理;措施  中
期刊
[摘要]在现代战役中,我国军事后勤物资保障需求存在着数量巨大、种类繁多,且时间紧、任务重等特点。后方保障基地要在有限的时间内保质保量的完成好繁重的物资发放及运送任务,人工决策模式已远远不能满足后方物资发放及运送的需要。本课题是以某后勤保障基地“后方支援保障系统”项目为平台,在对智能决策支持系统(DSS)的关键技术进行研究的基础上,完成了系统的设计和系统的实现,最后对系统的主要功能进行了总结。  [
期刊
[摘要]计量学应用的最早领域包括力学,计量主要包括力值、质量、扭矩、恒加速度、硬度、震动、转速、流速、真空、冲击、容量、流量、压力等计量测试。力学仪器种类繁多,且涉及领域较为广泛,但力学计量仪器在检定时应遵照一定的标准方式,并且要考虑到相关共性问题,本篇文章针对力学计量仪器检定中的相关问题进行了简要的分析。  [关键词]力学 计量仪器 检定 相关问题  中图分类号:03 文献标识码:A 文章编号:
期刊