论文部分内容阅读
摘 要:本文从业务实战角度探讨了数据在检察案件中的应用,描述了数据在检察系统电子取证应用的现状及存在的局限性,探讨了多数据分析在案件中可能的应用及多数据分析软件现阶段的状态和存在的技术难点,最后肯定了多数据分析是大数据时代来临的前奏。
关键词:检察;电子取证;数据分析;可视化分析
过去,一旦数据的基本用途实现了,我们便认为数据已经达到了它的目的,准备将其删除,让他就此消失。毕竟,数据的首要价值已经得以提取。而在大数据时代,数据就像一个神奇的钻石矿,在其首要价值被发掘之后仍能不断产生价值。数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。①到2013年,世界上存储的数据预计能达到约1.2泽字节,我们从未像今天一样产生如此海量的数据。②在证据电子化的大趋势下,数据在案件中的作用越来越重要。在检察案件中利用电信公司用于计费的话单进行分析,查询嫌疑人的生活习惯和人脉关系就是数据再利用最好的例证。
一、现状
计算机和网络技术的飞速发展和使用成本的降低,使计算机和网络进行信息沟通已成为社会生活不可缺少的一部分。手机、计算机、平板电脑、电话、各种数码产品等通信终端的多样化,以及论坛、微博、电子邮件、即时消息等多种通信产品的涌现,每个行为主体之间的通信方式、媒介多种多样,造成行为主体的通信行为轨迹分散,信息以片段的形式存在,向电子数据取证提出了更大的挑战。现有的单一电子数据取证模式,很难有效地实现信息全面整合、深度综合分析、关联线索碰撞并形成有价值的分析结论,而这些以片段形式存在的信息都是案件信息、案件线索及案件突破的宝库,如何有效使用这些信息已经是摆在我们面前的一个重要问题。
公安系统在信息化一期建设中已经围绕“还原真实,证明已经发生过的原始状态”建立了多种数据库,并在案件中屡立奇功。2013年底最高检建立了大数据分析平台,并在多个单位设有接入点。2014年9月,某省检察院在职务犯罪侦查过程中,引入了大数据分析软件,可以在短时间内将犯罪嫌疑人基本情况、关联线索信息、行踪轨迹、人际关系网络等情况清晰分析展示,大力提升了办案效率与效果。③
某省检察院自2007年建立电子取证实验室以来,省内绝大部分地市建立了电子取证实验室、大部门县区购买了手机取证、现场勘查箱、话单分析软件等前端采集分析设备。省检察院技术处及各地市检察院技术截止2014年已持续建设7年,协助办理了大量的电子取证案件(含提供案件线索)。这些案件中获取的大量数据在实现其初步价值后就被删除或丢弃,丧失了产生二次、三次价值的机会,丢掉了一个本来应该拥有的信息查询和案件线索深入再挖掘的机会(公安系统在各个派出所布置有采集点在大量的采集所有涉案或可能涉案人员的信息建立数据库)。
二、应用
其实,这些数据一直案件办理过程中为我们不断的创造着价值,如:通过电子取证设备固定嫌疑人的证据,通过话单分析软件分析犯罪嫌疑人的生活习惯、活动规律、潜藏地点,通过银行查账记录确认犯罪嫌疑人资金流向、受贿金额等。只是缺少系统的建设、规划和综合利用罢了。大部分的数据价值都是潜在的,需要通过创新性的分析来释放。有时,处于休眠状态的数据的价值只能通过与另一个截然不同的数据集结合才能释放出来。用新的方式混合分析这些数据,将得出更有价值的结果。
数据的浪费也是一种极大的浪费,在数据的处理思维上不仅将数据作为对象来处理,更要作为一种可重复利用资源的处理,我们需要新的数据思维模式。我省经过近7年持续的电子取证实验室建设和侦查技术装备采购,已经具备了将各个单位连起来,做数据采集、积累案件查询的条件。利用多数据分析软件结合现有的电子取证设备和其他数据采集分析设备整合资源,将现有的数据收集和积累起来实现对海量数据的分布式处理和分析。将会实现信息查询、信息共享、远程协助、远程协同、关联查询等功能。通过多人对事关行为主体的关联查询、比对碰撞、轨迹描述、串并分析,从时间、地域、人员、事件、资产、行踪、组织等方面,对信息进行组合分析和深入挖掘,最终智能分析出犯罪嫌疑人与相关人的关系网络、活动规律、资产交易关系等,深度挖掘案件线索,挖掘出更准、更大的情报线索,从而辅助侦查人员确定侦查方向和重点。
三、难点
现有多数据分析软件多是基于公安指定的规范标准进行的设计,基于公安的业务应用建设,并没有真正结合检察业务的应用。采集、捕获的数据来源于多个厂家或不同的数据库系统,不同程度的存在数据属性描述和定义不一致、不规范问题。图片、word文档、视频等非结构化的数据暂时无法导入系统数据库;语义分析、模糊定义查询、模型建设都尚待需要技术的突破,截止目前为止这些问题都还没有得到很好的解决。
四、小结
截止目前为止检察机关已建立了无行贿犯罪档案查询库、信息查询平台,将建立和完善在逃职务犯罪嫌疑人信息数据库,这些数据库已经在实际的案件中发挥着无可替代的作用。多数据的大数据分析是一个积累和衍生的过程,我们不但需要在实战工作中逐步积累数据,更需要不断的完善新的业务应用模式和模型。
技术创新和业务应用是一个从量变到质变的过程,随着并行计算能力不断提升和云存储等技术产品成本的不断降低,人工智能、语义分析、行为分析技术的完善,将会使多数据分析真正走到了大数据分析的临界点实现现实意义的大数据分析。多数据可视化分析在国内处在起步应用阶段,在检察系统的应用更处于探索、尝试阶段,我们更需要有能结合检察业务应用的软件和积极尝试新技术、新思路在案件中应用的勇气和与时俱进探索新应用的精神。
注释:
①摘自[英]维克托.迈尔-舍恩伯格 肯尼思·库克耶 著《大数据时代》第13页
②摘自[英]维克托.迈尔-舍恩伯格 肯尼思·库克耶 著《大数据时代》第134、135页
③摘自正义网9月10日贵州讯
关键词:检察;电子取证;数据分析;可视化分析
过去,一旦数据的基本用途实现了,我们便认为数据已经达到了它的目的,准备将其删除,让他就此消失。毕竟,数据的首要价值已经得以提取。而在大数据时代,数据就像一个神奇的钻石矿,在其首要价值被发掘之后仍能不断产生价值。数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。①到2013年,世界上存储的数据预计能达到约1.2泽字节,我们从未像今天一样产生如此海量的数据。②在证据电子化的大趋势下,数据在案件中的作用越来越重要。在检察案件中利用电信公司用于计费的话单进行分析,查询嫌疑人的生活习惯和人脉关系就是数据再利用最好的例证。
一、现状
计算机和网络技术的飞速发展和使用成本的降低,使计算机和网络进行信息沟通已成为社会生活不可缺少的一部分。手机、计算机、平板电脑、电话、各种数码产品等通信终端的多样化,以及论坛、微博、电子邮件、即时消息等多种通信产品的涌现,每个行为主体之间的通信方式、媒介多种多样,造成行为主体的通信行为轨迹分散,信息以片段的形式存在,向电子数据取证提出了更大的挑战。现有的单一电子数据取证模式,很难有效地实现信息全面整合、深度综合分析、关联线索碰撞并形成有价值的分析结论,而这些以片段形式存在的信息都是案件信息、案件线索及案件突破的宝库,如何有效使用这些信息已经是摆在我们面前的一个重要问题。
公安系统在信息化一期建设中已经围绕“还原真实,证明已经发生过的原始状态”建立了多种数据库,并在案件中屡立奇功。2013年底最高检建立了大数据分析平台,并在多个单位设有接入点。2014年9月,某省检察院在职务犯罪侦查过程中,引入了大数据分析软件,可以在短时间内将犯罪嫌疑人基本情况、关联线索信息、行踪轨迹、人际关系网络等情况清晰分析展示,大力提升了办案效率与效果。③
某省检察院自2007年建立电子取证实验室以来,省内绝大部分地市建立了电子取证实验室、大部门县区购买了手机取证、现场勘查箱、话单分析软件等前端采集分析设备。省检察院技术处及各地市检察院技术截止2014年已持续建设7年,协助办理了大量的电子取证案件(含提供案件线索)。这些案件中获取的大量数据在实现其初步价值后就被删除或丢弃,丧失了产生二次、三次价值的机会,丢掉了一个本来应该拥有的信息查询和案件线索深入再挖掘的机会(公安系统在各个派出所布置有采集点在大量的采集所有涉案或可能涉案人员的信息建立数据库)。
二、应用
其实,这些数据一直案件办理过程中为我们不断的创造着价值,如:通过电子取证设备固定嫌疑人的证据,通过话单分析软件分析犯罪嫌疑人的生活习惯、活动规律、潜藏地点,通过银行查账记录确认犯罪嫌疑人资金流向、受贿金额等。只是缺少系统的建设、规划和综合利用罢了。大部分的数据价值都是潜在的,需要通过创新性的分析来释放。有时,处于休眠状态的数据的价值只能通过与另一个截然不同的数据集结合才能释放出来。用新的方式混合分析这些数据,将得出更有价值的结果。
数据的浪费也是一种极大的浪费,在数据的处理思维上不仅将数据作为对象来处理,更要作为一种可重复利用资源的处理,我们需要新的数据思维模式。我省经过近7年持续的电子取证实验室建设和侦查技术装备采购,已经具备了将各个单位连起来,做数据采集、积累案件查询的条件。利用多数据分析软件结合现有的电子取证设备和其他数据采集分析设备整合资源,将现有的数据收集和积累起来实现对海量数据的分布式处理和分析。将会实现信息查询、信息共享、远程协助、远程协同、关联查询等功能。通过多人对事关行为主体的关联查询、比对碰撞、轨迹描述、串并分析,从时间、地域、人员、事件、资产、行踪、组织等方面,对信息进行组合分析和深入挖掘,最终智能分析出犯罪嫌疑人与相关人的关系网络、活动规律、资产交易关系等,深度挖掘案件线索,挖掘出更准、更大的情报线索,从而辅助侦查人员确定侦查方向和重点。
三、难点
现有多数据分析软件多是基于公安指定的规范标准进行的设计,基于公安的业务应用建设,并没有真正结合检察业务的应用。采集、捕获的数据来源于多个厂家或不同的数据库系统,不同程度的存在数据属性描述和定义不一致、不规范问题。图片、word文档、视频等非结构化的数据暂时无法导入系统数据库;语义分析、模糊定义查询、模型建设都尚待需要技术的突破,截止目前为止这些问题都还没有得到很好的解决。
四、小结
截止目前为止检察机关已建立了无行贿犯罪档案查询库、信息查询平台,将建立和完善在逃职务犯罪嫌疑人信息数据库,这些数据库已经在实际的案件中发挥着无可替代的作用。多数据的大数据分析是一个积累和衍生的过程,我们不但需要在实战工作中逐步积累数据,更需要不断的完善新的业务应用模式和模型。
技术创新和业务应用是一个从量变到质变的过程,随着并行计算能力不断提升和云存储等技术产品成本的不断降低,人工智能、语义分析、行为分析技术的完善,将会使多数据分析真正走到了大数据分析的临界点实现现实意义的大数据分析。多数据可视化分析在国内处在起步应用阶段,在检察系统的应用更处于探索、尝试阶段,我们更需要有能结合检察业务应用的软件和积极尝试新技术、新思路在案件中应用的勇气和与时俱进探索新应用的精神。
注释:
①摘自[英]维克托.迈尔-舍恩伯格 肯尼思·库克耶 著《大数据时代》第13页
②摘自[英]维克托.迈尔-舍恩伯格 肯尼思·库克耶 著《大数据时代》第134、135页
③摘自正义网9月10日贵州讯