一个基于Web的轻量级大数据处理与可视化工具

来源 :计算机科学 | 被引量 : 0次 | 上传用户:eyeknee1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科研人员在日常研究中经常使用Excel,Spss等工具对数据进行分析加工来获得相关领域知识。然而随着大数据时代的到来,常用的数据处理软件因单机性能的限制已经不能满足科研人员对大数据分析处理的需求。大数据的处理和可视化离不开分布式计算环境。因此,为了完成对大数据的快速处理和可视化,科研人员不仅需要购置、维护分布式集群环境,还需要具备分布式环境下的编程能力和相应的前端数据可视化技术。这对很多非计算机科班的数据分析工作者而言是非常困难且不必要的。针对上述问题,提出了一种基于Web的轻量级大数据处理和可视化工具。通过该工具,数据分析工作者只需通过简单的点击和拖动,便可以在浏览器中轻松地打开大型数据文件(GB级别)、快速地对文件进行定位(跳转到文件某一行)、方便地调用分布式计算框架来对文件内容进行排序或求极大值、便捷地对数据进行可视化等。实证研究证明,该解决方案是有效的。
其他文献
在中国传统金融已经满足不了大众对流动资金的需求,而民间融资以其操作简单、门槛低、融资速度快,形式多种多样的优点满足了中小企业及社会民众对流动资金的需求。我国应加快
文章着重论述了产业融合发展趋势下数字出版人才的培养问题。数字出版人才培养是数字出版"十三五"专项规划的重点,它顺应了出版学科发展的需要,是产业转型升级的必然要求。数
目的比较超声与内镜预测食管静脉曲张出血风险的能力。方法选取我院69例乙型肝炎肝硬化患者,其中既往有食管静脉曲张出血史且出血停止1周以上31例(出血组),既往无食管静脉曲
蛋白质组学(Proteomics)是后基因组学的主要内容之一,其近年来发展十分迅速,主要涉及两方面的内容:一是分离和分析细胞与组织样品的全蛋白质,即蛋白质组表达模式的研究:二是
党的十九大报告提出:“加快建立多主体供给、多渠道保障、租购并举的住房制度,让全体人民住有所居。”各级政府积极作为,全方位建立保障性安居工程项目保障体系。不仅有利于
开展高中生物理考试成败归因研究其目的主要是为了解高中生在物理考试之后是如何对考试结果进行归因,并利用归因训练对归因不合理的学生进行及时干预。通过探讨高中生物理考
目的:乳腺癌在女性癌症发病率中排名首位,我国女性乳腺癌的发病率正逐年上升。大多数抗乳腺癌的化疗药物缺乏特异性,对正常组织毒性强。在经历一段时间药物治疗后,癌细胞几乎
朗读是把文字语言转化为听觉的有声语言的活动。朗读是语文教学的重要组成部分,朗读不仅能使学生积累更多的语言、形成良好的交流能力,还能挖掘情感因素,带学生入情入境,形成
资产证券化业务自问世以来广受金融机构和投资者的青睐,但是直到2008年的金融危机爆发,资产证券化向世人展示了其对在银行风险累积以及危机蔓延过程中所隐藏的巨大隐患。直到
开放量子系统中,量子的状态会受到环境的作用而产生退相干,这是实际量子计算中人们面对的最大问题之一。量子测量可以被作为量子系统动力学转移的控制手段之一。在本文中,我