论文部分内容阅读
[摘 要]随着科技的发展和计算机技术的日渐成熟, 人类已经进人了信息化时代, 这使得人们生活和工作的方方面面都结束了传统的重复性的工作模式, 变得更加便捷。在档案信息管理工作中, 由于其工作内容相对繁杂, 数据量相对较大, 因此, 计算机技术的应用大大改进了以往的工作模式, 满足了信息的共享性、时效性和便捷性等多种特征。数据挖掘作为档案信息管理工作的重要信息技术之一, 具有其自身独特的功能和地位。本文分析了数据挖掘分析在档案信息管理中的应用。
[关键词]数据挖掘;档案信息管理;应用;
中图分类号:G647.24;G270.7 文献标识码:A 文章编号:1009-914X(2017)40-0335-01
从普遍意义上而言,数据挖掘就是从包含大量模糊、随机、有噪声的数据中通过一定的技术手段进行识别,将有效的、新颖的、或者潜在有用的数据进行集中处理,进而形成可以理解的知识。在实际应用中,数据挖掘往往通过各种分析工具的利用,从海量的数据中发掘模型和数据之间的关系,并可以据此作出一定的预测。
一、数据挖掘的功能
数据挖掘在实际操作的过程中,主要是针对未来的数据发展趋势以及具体行为进行预测性的决策制定。数据挖掘所涉及到的挖掘目标,通常情况下都是在数据库之中所发现的具有隐含知识以及相关意义的一项有效知识,按照不同是知识所呈现出的不同功能,主要可以划分成为以下几个方面:一是关联分析。关联分析是能够直接找到数据库之中大量不同数据之间的互相联系性方式,通常情况下,该技术分为序列模式以及关联规则这两个方面来加以应用、执行。从本质上来说,关联规则实质上就是发现某个事物与其他组成部分之间所存在的关联性、依赖性等因素。二是聚类。所输入的数据本身没有任何形式的标记存在,而聚类则是对不同的数据类型进行规划、集合,也就是将多个不同的对象组成多个不同的类,或者是形成簇,通过该方式能够直接使得同一个簇的数据拥有极高的相似度,不同的簇与簇之间存在着较大的差异性。聚类方式的存在,不但使得人们本身对于各个环节的认识进行了强化,同样还是对于概念以及偏差进行分析的一个必要条件。三是自动预测趋势和行为。数据挖掘自动在大型数据库中进行分类和预测,寻找预测性信息,自动地提出描述重要数据类的模型或预测未来的数据趋势,这样以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。
二、数据挖掘分析在档案信息管理中的应用
1.在档案分类管理中的应用。档案管理的基础工作之一是档案分类。计算机数据挖掘技术中的决策树算法能够按照一定的规则将不同类别、不同属性的档案信息在最短的时间内进行区分,并按照档案整理规则将档案进行归类整理,提升档案管理的归类速度、检索速度。应用计算机数据挖掘技术对档案进行分类管理的工作流程具体表现为:从众多的、不同类型的、不同特征的数据集中挑选中一些数据组合形成训练集(已经完成档案数据分类工作的数据集),数据集的构建符合分类模型的构建要求,在构建好训练集之后将其应用在没有完成分类工作的档案管理中,从而帮助档案管理者根据档案信息用户对档案信息的需求来进行档案分类总结,同时还可以根据用户的喜好为其推荐其他档案数据信息。通过这些具有针对性的档案数据挖掘分析能够提升用户获取数据信息的时间,实现对档案数据信息的高效利用,充分发挥出档案数据的价值。比如档案管理人员可以对档案使用者访问的网页内容、档案信息查询的间隔时间、档案信息查询的停留时间、档案信息的下载情况等信息进行科学、系统的分析和汇总,之后根据数据分析对档案使用者的兴趣、爱好进行总结,挖掘档案使用者的其他信息,比如档案使用者喜欢针对档案的内容提出问题等。通过对不同档案使用者的具体特点和档案喜好进行差异化分析,能够进一步提升档案使用者对档案信息的有效使用,提升档案信息服务质量。
2.在档案收集管理中的应用。计算机数据挖掘技术在档案收集管理中的应用主要是根据计算机数据库内部的数据信息描述来构建相应的数据模型。之后将计算机数据样本和数据模型进行对比发现二者之间的差异,如果计算机数据样本和数据模型之间相吻合,需要档案管理人员根据测试样本模型分类方式来对档案信息进行分类处理。档案收集管理中对计算机数据挖掘技术的应用要求是要对档案数据信息库进行全面的分析和测评,从而得到科学的档案收集方案。计算机数据挖掘技术在档案收集管理中的应用需要对档案库中的数据进行分析,经过分析建立专门的对已知数据详细描述的概念模型,将这个模型和测试样本比较。如果其中的一个模型在测试后被认可,则是可以应用这个模型来对档案收集分类管理。比如当档案管理工作人员针对某一件事向客户发放调查问卷的时候,会利用计算机数据挖掘技术将客户的回答输入到数据库中。在这个数据库中,档案管理人员可以借助系统对客户的回答内容从多个具体属性来进行描述,比如客户的年龄、职业等。在有新的客户回答被输入到数据库时,系统会对客户的需求进行分类。
3.在档案保留管理中的应用。档案保留法主要是指应用传统的档案管理手段来保留档案信息,使得档案信息不流失的过程。对于企业的发展来讲,留住老员工在某种程度上就是为企业的发展节省成本费用。为此,企业留住老员工所采取的一项重要措施就是对找到老员工档案流失的原因,并应用计算机数据挖掘技术来对老员工档案流失的情况进行细致的分析,根据分析结果采用相應的解决办法,从而避免企业老员工档案的流失。例如,在某个档案的管理网站中,数据挖掘可以自动统计使用者大量查阅档案的高峰期,有关的管理人员可以据此做好充足的准备,并采取一定的措施预防网站瘫痪等问题的发生。
三、档案信息数据处理中应用数据挖掘技术的重要性
首先,档案信息内容牵涉广泛,比如有关人员的隐私,或者当事人的智慧成果等等。这些信息一旦没有得到完善的保护,很可能侵犯到当事人的隐私权,并且为其生活带来不利影响。除此之外,档案信息不仅要长期保密,也要提升自身的保存质量。为此,可以在档案信息数据管理中应用数据挖掘技术,利用该技术来总结分析异常借阅行为,进而避免不正当利用行为的产生,从而高效维护档案信息内容。其次,还可以利用数据挖掘技术来分析档案的利用状况,并且在和利用者沟通交流的基础上,发现用户的利用方向和潜在用户,并提供针对性的档案信息服务。最后,针对我国档案管理人员普遍存在依靠经验来完成业务操作的特点。可以通过数据挖掘技术的应用,发现各个但却为档案形成的特征、规律以及档案使用范围,进而挖掘出档案收集工作的控制点。在此基础上推行量化档案鉴定的工作方式,促使档案鉴定过程的规范化和科学化。
综上所述,在我国当前科技技术飞速发展的过程中,人们开始越发重视数据挖掘所具有的重要性,尤其是利用数据挖掘技术在数字档案信息管理工作中所起到的便利性,对于我国当前的档案信息管理工作来说,起到了极其重要的作用。但是,必须要加以重视的是,在数字档案信息中对数据挖掘技术进行应用的过程中,务必要针对其中所涉及到的多个方面进行协调性研究,这对于网络档案的建设和运行来说,起到了极其重要的作用。
参考文献
[1] 尹崇光.档案信息管理系统中计算机数据挖掘技术的应用[J].数字技术与应用,2015(11):50.
[2] 曾雪峰.计算机数据挖掘技术开发及其在档案信息管理中的运用研究[J].科技创新与应用,2016(9):285.
[3] 於立勇.计算机数据挖掘技术应用在档案信息管理系统中的探讨[J].电脑知识与技术,2015(2):260-261.
[关键词]数据挖掘;档案信息管理;应用;
中图分类号:G647.24;G270.7 文献标识码:A 文章编号:1009-914X(2017)40-0335-01
从普遍意义上而言,数据挖掘就是从包含大量模糊、随机、有噪声的数据中通过一定的技术手段进行识别,将有效的、新颖的、或者潜在有用的数据进行集中处理,进而形成可以理解的知识。在实际应用中,数据挖掘往往通过各种分析工具的利用,从海量的数据中发掘模型和数据之间的关系,并可以据此作出一定的预测。
一、数据挖掘的功能
数据挖掘在实际操作的过程中,主要是针对未来的数据发展趋势以及具体行为进行预测性的决策制定。数据挖掘所涉及到的挖掘目标,通常情况下都是在数据库之中所发现的具有隐含知识以及相关意义的一项有效知识,按照不同是知识所呈现出的不同功能,主要可以划分成为以下几个方面:一是关联分析。关联分析是能够直接找到数据库之中大量不同数据之间的互相联系性方式,通常情况下,该技术分为序列模式以及关联规则这两个方面来加以应用、执行。从本质上来说,关联规则实质上就是发现某个事物与其他组成部分之间所存在的关联性、依赖性等因素。二是聚类。所输入的数据本身没有任何形式的标记存在,而聚类则是对不同的数据类型进行规划、集合,也就是将多个不同的对象组成多个不同的类,或者是形成簇,通过该方式能够直接使得同一个簇的数据拥有极高的相似度,不同的簇与簇之间存在着较大的差异性。聚类方式的存在,不但使得人们本身对于各个环节的认识进行了强化,同样还是对于概念以及偏差进行分析的一个必要条件。三是自动预测趋势和行为。数据挖掘自动在大型数据库中进行分类和预测,寻找预测性信息,自动地提出描述重要数据类的模型或预测未来的数据趋势,这样以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。
二、数据挖掘分析在档案信息管理中的应用
1.在档案分类管理中的应用。档案管理的基础工作之一是档案分类。计算机数据挖掘技术中的决策树算法能够按照一定的规则将不同类别、不同属性的档案信息在最短的时间内进行区分,并按照档案整理规则将档案进行归类整理,提升档案管理的归类速度、检索速度。应用计算机数据挖掘技术对档案进行分类管理的工作流程具体表现为:从众多的、不同类型的、不同特征的数据集中挑选中一些数据组合形成训练集(已经完成档案数据分类工作的数据集),数据集的构建符合分类模型的构建要求,在构建好训练集之后将其应用在没有完成分类工作的档案管理中,从而帮助档案管理者根据档案信息用户对档案信息的需求来进行档案分类总结,同时还可以根据用户的喜好为其推荐其他档案数据信息。通过这些具有针对性的档案数据挖掘分析能够提升用户获取数据信息的时间,实现对档案数据信息的高效利用,充分发挥出档案数据的价值。比如档案管理人员可以对档案使用者访问的网页内容、档案信息查询的间隔时间、档案信息查询的停留时间、档案信息的下载情况等信息进行科学、系统的分析和汇总,之后根据数据分析对档案使用者的兴趣、爱好进行总结,挖掘档案使用者的其他信息,比如档案使用者喜欢针对档案的内容提出问题等。通过对不同档案使用者的具体特点和档案喜好进行差异化分析,能够进一步提升档案使用者对档案信息的有效使用,提升档案信息服务质量。
2.在档案收集管理中的应用。计算机数据挖掘技术在档案收集管理中的应用主要是根据计算机数据库内部的数据信息描述来构建相应的数据模型。之后将计算机数据样本和数据模型进行对比发现二者之间的差异,如果计算机数据样本和数据模型之间相吻合,需要档案管理人员根据测试样本模型分类方式来对档案信息进行分类处理。档案收集管理中对计算机数据挖掘技术的应用要求是要对档案数据信息库进行全面的分析和测评,从而得到科学的档案收集方案。计算机数据挖掘技术在档案收集管理中的应用需要对档案库中的数据进行分析,经过分析建立专门的对已知数据详细描述的概念模型,将这个模型和测试样本比较。如果其中的一个模型在测试后被认可,则是可以应用这个模型来对档案收集分类管理。比如当档案管理工作人员针对某一件事向客户发放调查问卷的时候,会利用计算机数据挖掘技术将客户的回答输入到数据库中。在这个数据库中,档案管理人员可以借助系统对客户的回答内容从多个具体属性来进行描述,比如客户的年龄、职业等。在有新的客户回答被输入到数据库时,系统会对客户的需求进行分类。
3.在档案保留管理中的应用。档案保留法主要是指应用传统的档案管理手段来保留档案信息,使得档案信息不流失的过程。对于企业的发展来讲,留住老员工在某种程度上就是为企业的发展节省成本费用。为此,企业留住老员工所采取的一项重要措施就是对找到老员工档案流失的原因,并应用计算机数据挖掘技术来对老员工档案流失的情况进行细致的分析,根据分析结果采用相應的解决办法,从而避免企业老员工档案的流失。例如,在某个档案的管理网站中,数据挖掘可以自动统计使用者大量查阅档案的高峰期,有关的管理人员可以据此做好充足的准备,并采取一定的措施预防网站瘫痪等问题的发生。
三、档案信息数据处理中应用数据挖掘技术的重要性
首先,档案信息内容牵涉广泛,比如有关人员的隐私,或者当事人的智慧成果等等。这些信息一旦没有得到完善的保护,很可能侵犯到当事人的隐私权,并且为其生活带来不利影响。除此之外,档案信息不仅要长期保密,也要提升自身的保存质量。为此,可以在档案信息数据管理中应用数据挖掘技术,利用该技术来总结分析异常借阅行为,进而避免不正当利用行为的产生,从而高效维护档案信息内容。其次,还可以利用数据挖掘技术来分析档案的利用状况,并且在和利用者沟通交流的基础上,发现用户的利用方向和潜在用户,并提供针对性的档案信息服务。最后,针对我国档案管理人员普遍存在依靠经验来完成业务操作的特点。可以通过数据挖掘技术的应用,发现各个但却为档案形成的特征、规律以及档案使用范围,进而挖掘出档案收集工作的控制点。在此基础上推行量化档案鉴定的工作方式,促使档案鉴定过程的规范化和科学化。
综上所述,在我国当前科技技术飞速发展的过程中,人们开始越发重视数据挖掘所具有的重要性,尤其是利用数据挖掘技术在数字档案信息管理工作中所起到的便利性,对于我国当前的档案信息管理工作来说,起到了极其重要的作用。但是,必须要加以重视的是,在数字档案信息中对数据挖掘技术进行应用的过程中,务必要针对其中所涉及到的多个方面进行协调性研究,这对于网络档案的建设和运行来说,起到了极其重要的作用。
参考文献
[1] 尹崇光.档案信息管理系统中计算机数据挖掘技术的应用[J].数字技术与应用,2015(11):50.
[2] 曾雪峰.计算机数据挖掘技术开发及其在档案信息管理中的运用研究[J].科技创新与应用,2016(9):285.
[3] 於立勇.计算机数据挖掘技术应用在档案信息管理系统中的探讨[J].电脑知识与技术,2015(2):260-261.