论文部分内容阅读
【摘 要】 近年来民航领域的数据规模越来越巨大,但民航数据分布分散,数据结构存在差异形成了数据孤岛,没有得到有效治理。如何管理和利用数据,使其发挥价值,对个体及其企业做出贡献,是企业必须考虑的重要问题。为了使民航大数据有效治理,本文通过对民航元数据管理, 主数据管理,数据质量管理,数据标准化管理等方面对民航大数据进行分析,对民航大数据资源治理的具体机制进行了研究,初步形成了民航大数据资源治理架构。
【关键词】 大数据 资源治理 民航 元数据 主数据
引 言
民航信息化普及程度比较高,大量的民航机构、从业人员产生了海量的行业相关数据,这些数据分布在民航业不同的机构,数据异构严重。民航企业目前庞大的现存数据中,75%都是非结构化数据,包括各种文字,语音,图像,视频,社交关系,空间轨迹等。因为行业数据量较大,分布比较分散,导致数据整合能力较低,大量的行业信息被淹没在海量数据当中,没有得到充分的利用。各个信息化系统之间数据结构存在差异,形成了数据孤岛,没有形成民航领域内有效的数据治理机制。
2013年,王玮[1]指出有效治理大数据和挖掘分析其潜在的业务价值,是商业银行面临的新课题,從大数据时代的机遇和挑战,剖析数据治理面临的问题,并基于制定数据标准体系和流程、数据质量规划、评估和管理模式等方面提出大数据时代的数据治理措施。2014年,曾锋[2]针对贵阳机场各系统独立分散现状,自主设计构建了数据管理集成系统,详尽解析了数据管理集成系统的结构、功能和实现途径。2015年,李湘滨、郑芸、熊国民[3]结合中国民航的实际情况,提出了一种适用于开放平台旅客服务信息系统的主数据识别与管理方法,设计了主数据管理系统的功能架构,并分析了适用于此系统架构的两种关键技术。
由上述研究综述可知,民航信息化经过的多年的发展,基础设施比较完善,信息化系统也得到了广泛的应用,同时也储存了大量的操作数据以及事务数据,但一直以来对数据的管理研究主要集中在结构化数据的分析,民航大数据治理相关研究起步较晚,研究成果较少,较少,因此本文将对民航大数据治理机制进行具体研究具有理论和现实意义。。
1民航元数据管理
元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。
民航企业可以研究以OMG的公共仓库元模型为核心的元数据集成体系结构。在明确了元数据集成体系结构之后,民航企业可以根据需要选择合适的业务元数据和技术元数据管理工具,并制定相应的元数据管理制度进行全面的元数据管理。
民航大数据管理涉及到气象信息,航班信息,客票订座信息,地面服务信息等多个功能信息,各个功能的数据必须按照一定的模式存入数据仓库中。数据仓库中数据的对应关系及转换规则都要存储在元数据知识库中。忽视元数据管理,就会使数据集成出现混乱的局面,很难进行数据仓库的集成。
民航大数据数据容量大,具有多样性,75%是非结构化数据。通过创建体现关键大数据业务术语的业务定义词库(本体),该业务定义词库不仅包含结构化数据,还可以将半结构化和非结构化数据纳入其中。通过构建基础本体、领域本体、任务本体和应用本体,在整个企业范围提供一个完整的共享词汇表,保证每个元数据元素在信息供应链中每个组件的语义上保持一致。
2民航主数据管理
主数据是指在整个企业范围内各个系统间要共享的、高价值的数据,也称企业基准数据[4]。那么民航主数据就是在民航企业中各个系统所共享的有价值的数据,这些数据在被整理之前,分散于各个系统中,而民航主数据可以达到让这些数据通过集中整理分析,存储于同一系统中,这样可以更加方便快捷的查找并整合出最有价值的数据。
在民航主数据管理的应用方面,民航主数据管理应用于民航气象信息和民航客票订座信息管理等方面。
①民航气象信息:民航主数据管理系统可以收集并整理某个指定地区的所有气象信息,并且可以通过比对和分析,准确推断出未来某段时间的气象状况,为民航飞机航行安全做保证。
②民航客票订座信息:民航主数据管理系统可以根据乘客购买车票以及乘坐航班的实际乘客数量进行大数据分析,计算出最优的客票订座方案,从而使航空公司的利益达到最大化。
3民航数据质量管理
高质量的数据是大数据发挥作用的前提。如果不对大数据进行有效的数据质量管理,会使大数据会对决策产生有害的结果。大多数民航企业慢慢只能做到实时收集大数据,不注重对数据进行质量方面的管理,导致数据杂乱无章,最终成为无用的数据垃圾。如此大大降低了民航业对顾客的服务质量,降低了民航业的运营能力,以及与其他行业相比的竞争力。
6σ管理法是一种统计评估法,采用希腊字母“σ”来衡量标准偏差。6σ管理法强调制定极高的目标、收集数据以及分析结果,以减少产品和服务缺陷,是一种改善企业质量流程管理的技术。主要运用DMAIC模式,即Define、Measure、Analyze、Improve、Control五个步骤来改进项目。[5]可以采用基于6σ管理法方法对民航大数据进行质量管理。以下是在订座信息管理领域的质量管理步骤。
(1)Define
对订座信息的数据进行从准确性、一致性、时效性、唯一性等方面进行质量评估,为数据质量分析提供标准和依据。
(2)Measure
收集航空订座信息等数据,并从最多的和最少的订座位置、消费者订座的时间段等进行测量,并进行整理。此阶段是后续分析、改进和控制阶段的基础。
(3)Analyze
对于上阶段所测量的订座信息数据,通过对比分析整理的数据,得出消费者的订座偏好以及较为集中的订座时间段;进一步分析得出消费者的订座偏好和订座时间往往由哪些因素所决定。 (4)Improve
针对于订座信息数据而言,航空企业应按分析得出的结果制定出方案,如怎样营销才能使消費者不集中在靠窗位置的偏爱、才能使消费者“雨露均沾”;根据消费者倾向的订座时间应该如何调整订票开始时间以及优惠政策。
(5)Control
在大数据的质量管理控制阶段,在选择并确定了上述一种方案后,应有专人监控实施方案后消费者对订座的满意度、订座带来的盈利等信息数据,并及时进行改正和控制。
4民航数据标准化管理
2018年已经是中国民航信息化发展的第33年。在民航信息化领域,我国已经建立了一系列基础民航信息系统来初步帮助民航信息管理,但是随着科学技术的日益提高,中国民航也高速发展,民航信息管理面对的问题也越来越多,但是现有的信息系统并不能解决全部问题,并且对于现在日益严格的客户要求难以满足。因此我们在大力发展民航信息系统的阶段,务必要对数据标准化进行管理。
数据标准化意味着我们要为这些民航大数据,例如气象信息、航班信息、订座信息等制定一个标准,并进行标准化的管理。
数据标准管理由数据标准规划、数据标准化实施、数据标准反馈这三部分内容组成,而重点在于数据标准化实施阶段,由此又可细分为:数据标准制定、数据标准匹配,数据标准执行、数据标准维护和数据标准监控。
数据标准制定包括单词标准化、数据规范化,确保可靠的信息来源以及信息的及时性、准确性。
数据标准匹配主要是把四面八方收集来的信息(气象、客票订座、航班号等)准确地结合起来,提高工作组的高作效率。
数据标准执行是指在数据匹配完之后各民航企业的系统按照统一制定的标准开始实践。
数据标准维护是指在数据标准管理的同时时刻反馈运作状态,并根据当前及未来可能发生的情况进行修复和升级以减少错误率。
数据标准监控是指在数据标准执行的过程中,对数据的流通、加工及传送进行监视,并且及时反馈效果,同时也为数据标准的维护提供服务支持。
结束语
本文首先分析了大数据如今的现状以及民航大数据的具体困境,其次通过数据标准化管理,数据质量管理,主数据管理,和元数据管理对民航大数据资源治理机制进行了研究,初步形成了民航大数据治理架构,但研究不够深入,缺乏实践性,希望有朝一日能完全实现民航大数据资源治理。
【参考文献】
[1] 王玮大数据时代的商业银行数据治理研究[J].中国金融电脑,2013,(7):36-38.
[2] 曾锋.机场数据管理集成系统的设计应用[J].现代机械,2012(3):83-85.
[3] 李湘滨、郑芸、熊国民. 面向民航开放平台的主数据识别与管理[J]. 计算机与数字工程,2015(7):1304-1327.
[4] 李隽。主数据管理在供电企业中的应用研究[J].电力信息化,2010,9:9-12.
[5] 杨晶、陈晓冬.对6σ管理法的认识[J].发展,2006(12):78-79
【关键词】 大数据 资源治理 民航 元数据 主数据
引 言
民航信息化普及程度比较高,大量的民航机构、从业人员产生了海量的行业相关数据,这些数据分布在民航业不同的机构,数据异构严重。民航企业目前庞大的现存数据中,75%都是非结构化数据,包括各种文字,语音,图像,视频,社交关系,空间轨迹等。因为行业数据量较大,分布比较分散,导致数据整合能力较低,大量的行业信息被淹没在海量数据当中,没有得到充分的利用。各个信息化系统之间数据结构存在差异,形成了数据孤岛,没有形成民航领域内有效的数据治理机制。
2013年,王玮[1]指出有效治理大数据和挖掘分析其潜在的业务价值,是商业银行面临的新课题,從大数据时代的机遇和挑战,剖析数据治理面临的问题,并基于制定数据标准体系和流程、数据质量规划、评估和管理模式等方面提出大数据时代的数据治理措施。2014年,曾锋[2]针对贵阳机场各系统独立分散现状,自主设计构建了数据管理集成系统,详尽解析了数据管理集成系统的结构、功能和实现途径。2015年,李湘滨、郑芸、熊国民[3]结合中国民航的实际情况,提出了一种适用于开放平台旅客服务信息系统的主数据识别与管理方法,设计了主数据管理系统的功能架构,并分析了适用于此系统架构的两种关键技术。
由上述研究综述可知,民航信息化经过的多年的发展,基础设施比较完善,信息化系统也得到了广泛的应用,同时也储存了大量的操作数据以及事务数据,但一直以来对数据的管理研究主要集中在结构化数据的分析,民航大数据治理相关研究起步较晚,研究成果较少,较少,因此本文将对民航大数据治理机制进行具体研究具有理论和现实意义。。
1民航元数据管理
元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。
民航企业可以研究以OMG的公共仓库元模型为核心的元数据集成体系结构。在明确了元数据集成体系结构之后,民航企业可以根据需要选择合适的业务元数据和技术元数据管理工具,并制定相应的元数据管理制度进行全面的元数据管理。
民航大数据管理涉及到气象信息,航班信息,客票订座信息,地面服务信息等多个功能信息,各个功能的数据必须按照一定的模式存入数据仓库中。数据仓库中数据的对应关系及转换规则都要存储在元数据知识库中。忽视元数据管理,就会使数据集成出现混乱的局面,很难进行数据仓库的集成。
民航大数据数据容量大,具有多样性,75%是非结构化数据。通过创建体现关键大数据业务术语的业务定义词库(本体),该业务定义词库不仅包含结构化数据,还可以将半结构化和非结构化数据纳入其中。通过构建基础本体、领域本体、任务本体和应用本体,在整个企业范围提供一个完整的共享词汇表,保证每个元数据元素在信息供应链中每个组件的语义上保持一致。
2民航主数据管理
主数据是指在整个企业范围内各个系统间要共享的、高价值的数据,也称企业基准数据[4]。那么民航主数据就是在民航企业中各个系统所共享的有价值的数据,这些数据在被整理之前,分散于各个系统中,而民航主数据可以达到让这些数据通过集中整理分析,存储于同一系统中,这样可以更加方便快捷的查找并整合出最有价值的数据。
在民航主数据管理的应用方面,民航主数据管理应用于民航气象信息和民航客票订座信息管理等方面。
①民航气象信息:民航主数据管理系统可以收集并整理某个指定地区的所有气象信息,并且可以通过比对和分析,准确推断出未来某段时间的气象状况,为民航飞机航行安全做保证。
②民航客票订座信息:民航主数据管理系统可以根据乘客购买车票以及乘坐航班的实际乘客数量进行大数据分析,计算出最优的客票订座方案,从而使航空公司的利益达到最大化。
3民航数据质量管理
高质量的数据是大数据发挥作用的前提。如果不对大数据进行有效的数据质量管理,会使大数据会对决策产生有害的结果。大多数民航企业慢慢只能做到实时收集大数据,不注重对数据进行质量方面的管理,导致数据杂乱无章,最终成为无用的数据垃圾。如此大大降低了民航业对顾客的服务质量,降低了民航业的运营能力,以及与其他行业相比的竞争力。
6σ管理法是一种统计评估法,采用希腊字母“σ”来衡量标准偏差。6σ管理法强调制定极高的目标、收集数据以及分析结果,以减少产品和服务缺陷,是一种改善企业质量流程管理的技术。主要运用DMAIC模式,即Define、Measure、Analyze、Improve、Control五个步骤来改进项目。[5]可以采用基于6σ管理法方法对民航大数据进行质量管理。以下是在订座信息管理领域的质量管理步骤。
(1)Define
对订座信息的数据进行从准确性、一致性、时效性、唯一性等方面进行质量评估,为数据质量分析提供标准和依据。
(2)Measure
收集航空订座信息等数据,并从最多的和最少的订座位置、消费者订座的时间段等进行测量,并进行整理。此阶段是后续分析、改进和控制阶段的基础。
(3)Analyze
对于上阶段所测量的订座信息数据,通过对比分析整理的数据,得出消费者的订座偏好以及较为集中的订座时间段;进一步分析得出消费者的订座偏好和订座时间往往由哪些因素所决定。 (4)Improve
针对于订座信息数据而言,航空企业应按分析得出的结果制定出方案,如怎样营销才能使消費者不集中在靠窗位置的偏爱、才能使消费者“雨露均沾”;根据消费者倾向的订座时间应该如何调整订票开始时间以及优惠政策。
(5)Control
在大数据的质量管理控制阶段,在选择并确定了上述一种方案后,应有专人监控实施方案后消费者对订座的满意度、订座带来的盈利等信息数据,并及时进行改正和控制。
4民航数据标准化管理
2018年已经是中国民航信息化发展的第33年。在民航信息化领域,我国已经建立了一系列基础民航信息系统来初步帮助民航信息管理,但是随着科学技术的日益提高,中国民航也高速发展,民航信息管理面对的问题也越来越多,但是现有的信息系统并不能解决全部问题,并且对于现在日益严格的客户要求难以满足。因此我们在大力发展民航信息系统的阶段,务必要对数据标准化进行管理。
数据标准化意味着我们要为这些民航大数据,例如气象信息、航班信息、订座信息等制定一个标准,并进行标准化的管理。
数据标准管理由数据标准规划、数据标准化实施、数据标准反馈这三部分内容组成,而重点在于数据标准化实施阶段,由此又可细分为:数据标准制定、数据标准匹配,数据标准执行、数据标准维护和数据标准监控。
数据标准制定包括单词标准化、数据规范化,确保可靠的信息来源以及信息的及时性、准确性。
数据标准匹配主要是把四面八方收集来的信息(气象、客票订座、航班号等)准确地结合起来,提高工作组的高作效率。
数据标准执行是指在数据匹配完之后各民航企业的系统按照统一制定的标准开始实践。
数据标准维护是指在数据标准管理的同时时刻反馈运作状态,并根据当前及未来可能发生的情况进行修复和升级以减少错误率。
数据标准监控是指在数据标准执行的过程中,对数据的流通、加工及传送进行监视,并且及时反馈效果,同时也为数据标准的维护提供服务支持。
结束语
本文首先分析了大数据如今的现状以及民航大数据的具体困境,其次通过数据标准化管理,数据质量管理,主数据管理,和元数据管理对民航大数据资源治理机制进行了研究,初步形成了民航大数据治理架构,但研究不够深入,缺乏实践性,希望有朝一日能完全实现民航大数据资源治理。
【参考文献】
[1] 王玮大数据时代的商业银行数据治理研究[J].中国金融电脑,2013,(7):36-38.
[2] 曾锋.机场数据管理集成系统的设计应用[J].现代机械,2012(3):83-85.
[3] 李湘滨、郑芸、熊国民. 面向民航开放平台的主数据识别与管理[J]. 计算机与数字工程,2015(7):1304-1327.
[4] 李隽。主数据管理在供电企业中的应用研究[J].电力信息化,2010,9:9-12.
[5] 杨晶、陈晓冬.对6σ管理法的认识[J].发展,2006(12):78-79