论文部分内容阅读
“大数据”发展趋势中所增加的大部分数据都是在自然环境下产生的,比如说网络言论、图片和视频等不受控制的东西,以及来自于传感器的数据等。这些以每年50%的速度增长的所谓“非结构化数据”,通常不能为传统的数据库所用。大数据提供了更多的原材料,要让数据为企业竞争服务,我们作好了管理和处理大数据的准备了吗?
我们思考的数据量不管目前是TB级,还是不久会在PB级、甚至将来的EB级,搜索和处理量在万亿记录的“超数据”(Exadata)规模上运行,数据必须要成为信息情报才能为我们所用。
因此,迎接大数据的挑战,不仅仅是硬件的准备,处理和分析软件尤为重要情报分析系统要BI定量分析与竞争情报专题分析相结合,体现人机协作的关系。
从本质上来说,“数据”、“信息”、“情报”这三者是有本质的区别的。数据是指未经信息加工处理统计数字、消息、传言、观察到的现象,等等。数据具有原始性、不成熟性、不完整性、非结构等特点。信息是指经过提炼、加工和集成的数据,是经过一定处理流程后的产物,是大脑思维活动把客观事物运动和主观思维活动的状态描绘出来的结果。而情报是信息和智慧融合在一起并成为一项决策的依据。
数据与情报分析的关系是将大量原始、初级、杂乱无章的“数据”,转化为清晰地表达出一定含义的“信息”,继而从中按照企业竞争需要提取出有价值的“情报”并应用于企业竞争实践的过程。否则,不仅难以搭乘大数据这辆车,还会在情报分析的“稻草堆里捞针”时,“将稻草也看成是针”。
迎接大数据的挑战,不仅仅是硬件的准备,处理和分析软件尤为重要。具体来讲:
一是情报分析系统要将BI定量分析与竞争情报专题分析相结合,体现人机协作的关系;二是从互联网采集数据信息,或将其他数据系统中数据转化为比较分析结果、趋势预测、因素分析和关联规则等;三是构建由不同分析模板组成的通用、特定分析模板;四是建立分布式的多媒体数据库、模型库、情报知识库,具有先进的知识表达能力,拥有智能化的人机交互环境,能集成众多领域专家的知识、经验;五是有数据关系抽取和敏感信息预警功能,能够通过文本挖掘技术自动抽取数据之间的关系,并提供有多种可视化模板以支持数据之间关系的可视化显示。
我们思考的数据量不管目前是TB级,还是不久会在PB级、甚至将来的EB级,搜索和处理量在万亿记录的“超数据”(Exadata)规模上运行,数据必须要成为信息情报才能为我们所用。
因此,迎接大数据的挑战,不仅仅是硬件的准备,处理和分析软件尤为重要情报分析系统要BI定量分析与竞争情报专题分析相结合,体现人机协作的关系。
从本质上来说,“数据”、“信息”、“情报”这三者是有本质的区别的。数据是指未经信息加工处理统计数字、消息、传言、观察到的现象,等等。数据具有原始性、不成熟性、不完整性、非结构等特点。信息是指经过提炼、加工和集成的数据,是经过一定处理流程后的产物,是大脑思维活动把客观事物运动和主观思维活动的状态描绘出来的结果。而情报是信息和智慧融合在一起并成为一项决策的依据。
数据与情报分析的关系是将大量原始、初级、杂乱无章的“数据”,转化为清晰地表达出一定含义的“信息”,继而从中按照企业竞争需要提取出有价值的“情报”并应用于企业竞争实践的过程。否则,不仅难以搭乘大数据这辆车,还会在情报分析的“稻草堆里捞针”时,“将稻草也看成是针”。
迎接大数据的挑战,不仅仅是硬件的准备,处理和分析软件尤为重要。具体来讲:
一是情报分析系统要将BI定量分析与竞争情报专题分析相结合,体现人机协作的关系;二是从互联网采集数据信息,或将其他数据系统中数据转化为比较分析结果、趋势预测、因素分析和关联规则等;三是构建由不同分析模板组成的通用、特定分析模板;四是建立分布式的多媒体数据库、模型库、情报知识库,具有先进的知识表达能力,拥有智能化的人机交互环境,能集成众多领域专家的知识、经验;五是有数据关系抽取和敏感信息预警功能,能够通过文本挖掘技术自动抽取数据之间的关系,并提供有多种可视化模板以支持数据之间关系的可视化显示。