基于模板的大数据统计分析报告生成方法研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:thomas012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化不断推进,企业信息系统经过长期的应用实践,累积了大量的数据。数据是企业的核心,它影响着企业的业界竞争力和未来的发展,而报告是企业经营管理数据的重要载体。分析企业大量的历史数据,从中挖掘有价值的信息,并以图文并茂的方式呈现在报告中,为企业管理层的决策提供清晰直观且强有力的依据。目前大多数企业的报告系统都是根据需求定制的,报告中的数据和格式高度耦合度,离开了格式的数据毫无意义。如果需要修改或生成新的报告,只能重新编码进行二次开发,这严重影响了报告系统的灵活性与通用性,不能满足企业动态变化的需求。此外,企业中的数据来源往往不同,数据孤岛现象普遍存在,大多数的报告系统不支持对异构数据的分析,不能很好地挖掘数据价值。针对目前企业报告系统存在的问题,本文设计并提出基于模板的统计报告生成方法,并根据此方法编码实现一个大数据报告系统。本文的主要工作内容为:(1)提供了异构数据统一的获取接口,并利用数据仓库技术集成获取的数据,为报告提供数据基础。(2)设计了可复用的XML报告模板,报告模板由数据模板和格式模板组成,实现了数据和格式的分离,使得报告数据不再依赖格式存在。两种模板都采用可视化的设计方式,提高了系统的易用性。其中,格式模板设计界面采用类Excel风格,适合格式复杂的中式报表、报告开发。报告的模板化大大增加了报告系统的通用性和灵活性。(3)实现了配套的报告生成器,通过报告生成器解析报告模板的含义,生成完整的报告。由于模板中动态数据的存在,导致报告生成时模板会动态扩张,使得报告生成具有动态性、不确定性以及复杂性。对此,报告生成器提供了数据填充方法,将数据按一定的规则自动填入报告中。(4)设计并编码实现了一个Web报告系统,系统采用Hadoop技术集成不同数据源的数据,通过Hive、Impala大数据分析工具统计分析海量数据,大大提高了数据统计分析的效率。最后将报告系统集成到实验室合作的肇庆学院项目中实际应用,并对报告系统进行功能界面的运行展示和测试,验证了基于模板的统计报告生成方法的可行性。
其他文献
由于我国能源组织结构特殊性,煤炭能源会在较长时期内占据我国能源消耗的主导地位。因此,煤矿的生产安全关系着我国国民经济发展以及矿井工作人员的生命安全。煤炭开采过程中
DAC是由数字信号到模拟信号的转换器,它联系着数字和模拟世界,是收发机电路中的重要组成部分。现代移动通讯技术和集成电路技术的高速发展需要高精度、高速率、高带宽、低成本的DAC,而异质集成技术实现了III-V族化合物半导体和硅基CMOS器件的优势互补,使得这成为可能,并且适应着芯片三维堆叠、微系统化的发展。本文综合常见的DAC结构和不同方案的异质集成工艺,并进行可行性分析,最终选择基于微组装的裸芯对
为了查清园林绿化用景天植物的耐寒性,以八宝(Hylotelephium erythrostictum)、粗壮(Sedum cauticola cv.Praeger Robustum)、德国景天(Sedum hybirdum cv.Immergrunchell.)
为防止边界层低能流进入高超声速进气道导致总压恢复系数降低,在设计时要尽可能将边界层排除在进气道入口之外。鼓包作为一种边界层控制方法,已被确认在低马赫数来流下能有效
本文将超声速Bump的工作原理引入高超声速进气道设计以提高进气道的性能。但是直接将Bump装置加入高超声速进气道会造成严重的流动损失,因此提出一种适用于高超声速进气道的B
编辑的综合职业素养关系到图书产品的质量优劣,关系到图书出版产业的高质量发展。编辑应从政治素质、法律意识、编辑和出版实务技能、学科专业知识的积累和更新、市场意识、
在我国城市的快速发展中,已经从蔓延式发展转变为以建成区内部更新为主,并更加注重城市生活品质。我国提出的“幸福城市”建设,更加需要关注人的感知与体验。在现有的研究中,
凸包在控制边界层发展、降低激波边界层干扰、预防边界层分离上作用明显,是一种有效的、可靠的流动控制手段。目前在超声速战斗机上,凸包已经得到了广泛使用,但其在高超声速
南北朝时期,中国佛教的重心由般若学转向涅槃学。此时,心性问题被提到了佛学讨论的首要位置,出现了各种不同的心性学说。在这样的背景下,《大乘起信论》提出了独具自身特点的
战国时期,齐国豪侠孟尝君,以轻财下士著称,汇聚天下各路英豪,门下食客数千人。两千多年后的今天,同样在齐鲁大地上,当代齐鲁商侠岳诚博,传承仁、智、礼、义、信、孝的理念,从