论文部分内容阅读
摘 要:随着计算机技术的迅速发展,运算和处理巨量数据的重要性日益突显。随着互联网技术的高速发展,计算机正逐步改变人们的生产、生活及工作方式。在计算机普及的过程中,数据处理能力变得重要起来,因此,这就要求相关工作者必须采取强有力的措施来保证计算机处理数据的速度和质量。针对此类情况,本文对计算机大数据进行分析、对云计算网络技术进行了探讨与分析,以期对未来计算机的发展提供参考与借鉴。
关键词:计算机网络;大数据分析;云计算技术;数据处理
数据(Data)是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据经过解释并赋予一定的意义之后,便成为信息。数据处理(DataProcessing)是对数据的采集、存储、检索、加工、变换和传输。众所周知,单一计算机运算精度和数据处理的能力始终有限,为解决此类问题,主要针对数据集合处理、数据处理模式、分布式存储和分布式计算等方面进行研究。
一、大数据与云计算的定义
大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。云计算是分布式运算、并行计算、效用计算、网络储存、虚拟化、负载均衡及热备份冗余等传统计算机和网络技术发展融合的产物。
二、数据处理的重要性
有利于完整地、正确地反映客观情况。为了完整地、正确地反映客观情况,必须在实事求是的原则下,经过大量的、丰富的统计资料和数据进行加工制作及分析研究,才能做出科学的判断,并编写成数据分析報告。有利于数据资料的深度开发利用。数据分析部门通过执行定期统计报表制度和通过普查、抽查及调查等多种形式的统计方式,收集到系统的、丰富多样的数据,通过对此类数据资料的进一步加工整理,并进行认真的分析研及进行多层次的开发利用,才能使之成为内容丰富、形式多样的重要信息。有利于实现科学化管理和统计参与决策。数据分析部门利用数据资料丰富的优势,开展分析研究,透过事物的表面现象深入到事物的内在本质,由感性认识阶段上升到理性认识阶段,实现认识运动质的飞跃,从而提示事物的现状及其内在联系和发展规律。其它方面的需要。对数据处理的需要还包括大量、高速、多样、低价值密度及数据真实性等。
三、云计算网络技术的优势与缺陷
云计算网络的优势为以下四点:
(1)降低计算机成本:无需传统软件所需的硬盘空间或处理能力,所有应用均在云端运行。
(2)改进的性能:因为程序和进程少,所以云计算系统中的计算机运行更加高效。
(3)几近无限的存储容量:既然是处于云端的计算机,存储容量更不必说。(4)储存的数据具有安全性:由于所有数据均储存在云端中,丝毫不必担心数据丢失。
云计算网络的缺陷为以下两点:
(1)云计算网络对于用户数据的安全性并没有有效的保障。当组织选择在公共云上存储数据或主机应用程序时,将失去对承载其信息的服务器进行物理访问的能力。因此,未经授权的用户也可以通过某些手段访问相关的数据。
(2)云计算网络虚拟化具有安全隐患。操作系统和底层硬件由于虚拟化技术,使二者的关系发生了巨大的变化,导致存储和运算,甚至网络均发生变化。虚拟化在云基础设施这一方面的使用,为使用者带来了相应的安全隐患。
四、大数据分析的优势与缺陷
可视化分析,这一功能可以十分直观清晰地呈现出数据的结构和特点。数据挖掘算法是大数据分析的理论核心,各种数据挖掘的算法基于不同的数据类型和格式,能更加科学的呈现出数据本身具备的特点,正是因为这些,科学家才能深入数据内部,挖掘出更高的价值。大数据分析有着许多应用领域,其中预测性分析是重中之重,从大数据中分析出特点,结合科学建模、基于数据模型、代入新的数据,从而预测未来数据。语义引擎,需要足够的科学技术,主动分析数据并提取相关信息。大数据分析与数据管理和数据质量息息相关,高质量数据和高效的管理,无论是在学术研究还是在商业应用领域,都能保证其分析结果的有效性和真实性。
大数据拥有着巨大的发展潜力的同时,一些隐私派也开始有所动作,因为有越来越多的数据被人们收集,不管有心还是无意,某些数据已经通过社交媒体传播出去,无形之中泄露自己日常生活的一些数字细节。由于巨量的数据集合,所以据此作出的相关预测可能会出现虚假信息,这种信息会直接导致偏离原本预期的决策。除此之外,使用数据的人也分善恶,数据作用于的事情也分好坏,是一柄双刃剑。数据处理的重点在于对数据的采集、存储、检索、加工、变换和传输,与现有的数据分析技术相比,传统数据处理具有一定的弊端和通病。下面将从以下两个方面进行论述:非结构化数据处理和数据安全性。非结构化数据开始扮演重要角色。目前普遍所认知的数据分为两大类:一类用数据或统一的结构加以表示,被称之为结构化数据,例如数字、符号等。无法用数字或统一结构表示的另一类信息则被称为非结构化数据,如文本、图像、声音、网页等。若采用以往的传统数据分析,只能对结构化数据进行处理分析,且这部分数据简单易理解,只通过抽样极小一部分数据集,来完成对整个数据集的预判。在实际发展过程中,所产生的数据形式花样繁多,而非结构化数据分析是基于海量数据处理分析之上的,因此得出的结果更为精准。数据安全性无法得到稳定的保障。数据安全性问题一直是数据处理的一大难题,因为部分核心数据会涉及到所谓的机密,若想确保数据以安全的方式交予大数据公司,往往需耗费额外的时间和经济成本。
参考文献:
[1]谢华成,陈向东.面向云存储的非结构化数据存取[J].计算机应用,2012,32(7):1924-1928.
[2][法]乔治?纳汉.“大数据”时代的计算机信息处理技术[J].世界科学,2012(2):30-31.
[3]刘润生.迎接大数据浪潮[J].科学中国人,2013(11):13-14.
[4]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1)146-149.
作者简介:
张子明,男,黑龙江省绥化市海伦市海伦农垦社区,本科,就读于辽东学院信息工程学院B1506计算机科学与技术专业,学号:0917150612,研究方向:计算机科学与技术。
赵明宣,男,辽宁省抚顺市顺城区,本科,就读于辽东学院信息工程学院B1506计算机科学与技术专业,学号:0917150615研究方向:计算机科学与技术。
关键词:计算机网络;大数据分析;云计算技术;数据处理
数据(Data)是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据经过解释并赋予一定的意义之后,便成为信息。数据处理(DataProcessing)是对数据的采集、存储、检索、加工、变换和传输。众所周知,单一计算机运算精度和数据处理的能力始终有限,为解决此类问题,主要针对数据集合处理、数据处理模式、分布式存储和分布式计算等方面进行研究。
一、大数据与云计算的定义
大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。云计算是分布式运算、并行计算、效用计算、网络储存、虚拟化、负载均衡及热备份冗余等传统计算机和网络技术发展融合的产物。
二、数据处理的重要性
有利于完整地、正确地反映客观情况。为了完整地、正确地反映客观情况,必须在实事求是的原则下,经过大量的、丰富的统计资料和数据进行加工制作及分析研究,才能做出科学的判断,并编写成数据分析報告。有利于数据资料的深度开发利用。数据分析部门通过执行定期统计报表制度和通过普查、抽查及调查等多种形式的统计方式,收集到系统的、丰富多样的数据,通过对此类数据资料的进一步加工整理,并进行认真的分析研及进行多层次的开发利用,才能使之成为内容丰富、形式多样的重要信息。有利于实现科学化管理和统计参与决策。数据分析部门利用数据资料丰富的优势,开展分析研究,透过事物的表面现象深入到事物的内在本质,由感性认识阶段上升到理性认识阶段,实现认识运动质的飞跃,从而提示事物的现状及其内在联系和发展规律。其它方面的需要。对数据处理的需要还包括大量、高速、多样、低价值密度及数据真实性等。
三、云计算网络技术的优势与缺陷
云计算网络的优势为以下四点:
(1)降低计算机成本:无需传统软件所需的硬盘空间或处理能力,所有应用均在云端运行。
(2)改进的性能:因为程序和进程少,所以云计算系统中的计算机运行更加高效。
(3)几近无限的存储容量:既然是处于云端的计算机,存储容量更不必说。(4)储存的数据具有安全性:由于所有数据均储存在云端中,丝毫不必担心数据丢失。
云计算网络的缺陷为以下两点:
(1)云计算网络对于用户数据的安全性并没有有效的保障。当组织选择在公共云上存储数据或主机应用程序时,将失去对承载其信息的服务器进行物理访问的能力。因此,未经授权的用户也可以通过某些手段访问相关的数据。
(2)云计算网络虚拟化具有安全隐患。操作系统和底层硬件由于虚拟化技术,使二者的关系发生了巨大的变化,导致存储和运算,甚至网络均发生变化。虚拟化在云基础设施这一方面的使用,为使用者带来了相应的安全隐患。
四、大数据分析的优势与缺陷
可视化分析,这一功能可以十分直观清晰地呈现出数据的结构和特点。数据挖掘算法是大数据分析的理论核心,各种数据挖掘的算法基于不同的数据类型和格式,能更加科学的呈现出数据本身具备的特点,正是因为这些,科学家才能深入数据内部,挖掘出更高的价值。大数据分析有着许多应用领域,其中预测性分析是重中之重,从大数据中分析出特点,结合科学建模、基于数据模型、代入新的数据,从而预测未来数据。语义引擎,需要足够的科学技术,主动分析数据并提取相关信息。大数据分析与数据管理和数据质量息息相关,高质量数据和高效的管理,无论是在学术研究还是在商业应用领域,都能保证其分析结果的有效性和真实性。
大数据拥有着巨大的发展潜力的同时,一些隐私派也开始有所动作,因为有越来越多的数据被人们收集,不管有心还是无意,某些数据已经通过社交媒体传播出去,无形之中泄露自己日常生活的一些数字细节。由于巨量的数据集合,所以据此作出的相关预测可能会出现虚假信息,这种信息会直接导致偏离原本预期的决策。除此之外,使用数据的人也分善恶,数据作用于的事情也分好坏,是一柄双刃剑。数据处理的重点在于对数据的采集、存储、检索、加工、变换和传输,与现有的数据分析技术相比,传统数据处理具有一定的弊端和通病。下面将从以下两个方面进行论述:非结构化数据处理和数据安全性。非结构化数据开始扮演重要角色。目前普遍所认知的数据分为两大类:一类用数据或统一的结构加以表示,被称之为结构化数据,例如数字、符号等。无法用数字或统一结构表示的另一类信息则被称为非结构化数据,如文本、图像、声音、网页等。若采用以往的传统数据分析,只能对结构化数据进行处理分析,且这部分数据简单易理解,只通过抽样极小一部分数据集,来完成对整个数据集的预判。在实际发展过程中,所产生的数据形式花样繁多,而非结构化数据分析是基于海量数据处理分析之上的,因此得出的结果更为精准。数据安全性无法得到稳定的保障。数据安全性问题一直是数据处理的一大难题,因为部分核心数据会涉及到所谓的机密,若想确保数据以安全的方式交予大数据公司,往往需耗费额外的时间和经济成本。
参考文献:
[1]谢华成,陈向东.面向云存储的非结构化数据存取[J].计算机应用,2012,32(7):1924-1928.
[2][法]乔治?纳汉.“大数据”时代的计算机信息处理技术[J].世界科学,2012(2):30-31.
[3]刘润生.迎接大数据浪潮[J].科学中国人,2013(11):13-14.
[4]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1)146-149.
作者简介:
张子明,男,黑龙江省绥化市海伦市海伦农垦社区,本科,就读于辽东学院信息工程学院B1506计算机科学与技术专业,学号:0917150612,研究方向:计算机科学与技术。
赵明宣,男,辽宁省抚顺市顺城区,本科,就读于辽东学院信息工程学院B1506计算机科学与技术专业,学号:0917150615研究方向:计算机科学与技术。