论文部分内容阅读
摘要:介绍了大数据及农业科技档案的概念,分析了目前我国农业科技档案缺乏连续性及完整性、管理模式单一、服务缺乏共享机制的现状。阐述了大数据背景下农业科技档案的管理,即提升档案管理的“价值链”,注重科技档案价值的综合评价,建立农业科技档案数据库,注重数据挖掘,利用运筹学来进行农业科技档案信息优化,并保障档案安全。
关键词:大数据;农业科技档案;管理
中图分类号:F49文献标识码:Adoi:10.19311/j.cnki.16723198.2017.32.031
1何为大数据
大数据是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过整合共享、交叉复用,形成的智力资源和知识服务能力。大数据的特点具有囊括各行各业的海量数据,查找所需数据时运算速度超快、指数型、对数型、超越型等数据类型冗繁数据的利用价值超高,既能进行回顾性统计分析,又能进行前瞻性预测。
大数据的核心是预测,通过对海量数据的分析来预测事情发生的可能性。大数据不关注定量的存在,而是致力于数据价值的深层挖掘和开发。
随着大数据时代的来临,数据已经成为人们生活中不可缺少的资源,数据可视为航空航天、经济金融、医疗教育、工业制造、农业信息等行业的资产。科研离不开数据为支撑,离开了数据则变为漫天打炸雷。
2何为农业科技档案
档案是一种原始信息,它具有真实可靠性。档案类型众多,内容复杂。其中之一的农业科技档案,就含文字和计算、图表和照片等二维资料,还包含实物和标本等三维材料。
农业科技档案本质上为农业信息。农业信息的特点为:受季节和气候的影响,具有强烈的地域性,土壤的酸碱度南北方差异大。它包含二维、三维等不同维度,富有立体感处于动态之中。因此,农业科技档案的内容很复杂。
在大数据背景下,我国农业正在逐步转向现代农业、数字农业与信息农业。农业科技档案正在成为具有科学价值和实用意义的农业信息资源。
3目前我國农业科技档案的现状
3.1档案信息缺乏连续性及完整性,管理模式单一
目前的农业科技档案,过于功利,且视野狭窄,仅将获重要成果的项目申报材料,项目工作总结,项目验收报告,项目成果鉴定,项目奖励证明等资料归档,而对倾注于大量人力物力,掌握了众多真实数据,但由于种种原因导致失败的项目资料不予归档。不仔细分析原因,认识不到失败的项目亦存在重大的研究价值,无视前车之鉴、后车之师之理,存喜不存忧,收集档案的视野缺乏完整性。
农业科研因受自然条件和生态系统的影响,农业科研档案的形成周期长,干扰因素多,收集难度大,导致收集的内容易缺乏连续性。
正由于缺乏完整性及连续性,在利用档案进行分析统计时,可能出现奇点,找不到极值点(即最优解)。这将直接影响其价值信息的分析和利用。
现阶段,农业科技档案载体仍然以纸质为主,虽说有少量的资料储存于计算机上,但缺乏数据分析及数据挖掘缺乏安全屏障。随着农业由“平面式”向“立体式”发展,由“农场式”向“公园式”发展,由“自然式”向“设施式”发展,农业科研内容不断增多,便于携带的纸质二维图和三维图颇受人们青睐,采摘体验效果图,设施布局景观图颇受人们追捧,这样必将导致纸质档案所需存储空间越来越大,传统的单纯纸质档案的管理显然跟不上时代的步伐。
3.2档案管理服务缺乏共享机制
过去的档案工作是你需要什么,我帮你查找什么,其余不管。档案工作人员决不越雷池半步。这种模式即将被时代抛弃。
在大数据时代,档案管理人员应扮演信息专家的角色。应能根据用户需求,依系统论、信息论、控制论、耗散结构轮的思想,利用数理统计、数据挖掘、排队分析等工具,快速寻找出有价值的信息满足用户,同时还应具备三种能力。 “一是具备数学知识为数据集构模;二是具备过程技能建成数据模型分析系统;三是发现见解,从数据中讲出故事来”。不仅如此,档案管理人员还应熟悉本单位的业务,能以市场为导向,以效益为准则,给本单位提出科研建议,让科研更接地气,让科研活动发出勃勃生机。
4大数据背景下农业科技档案的管理
近年来,有学者提出了“加快云计算与大数据处理技术研究与农业应用,开发农业大数据库管理系统”的建议。亦有学者提出了农业数据挖掘系统的构建方案,对于通过数据技术来进一步提升农业信息服务水平具有一定意义。
这些已说明学者们已经察觉到高科技在农业中的作用,已肯定了大数据是农业科研不可或缺的平台。认识到只有依靠高科技手段,运用大数据储存,运用云计算处理,运用数据挖掘发现,才能解决农业科研中的农业信息资源的问题。农业科技档案是农业信息资源,如何在大数据背景下进行农业科技档案管理是亟待解决的问题。
4.1提升档案管理的“价值链”,注重科技档案价值综合评价
感知用户需求,拓展档案数据服务内涵,实施个性化农业科技档案管理。依据省部级、地级、县级不同的项目层次,提供不同的特色服务,形成不同的项目档案管理的“价值链”,即“收集、整理、分类、存贮、统计、保管、检索、汇编加工,开发利用”的综合体。
用动态生成的观点审视价值链,档案管理的每一个步骤都环环相扣,缺一不可。只有做好每一步的工作,才能使整个价值链熠熠生辉,同时,完善的价值链能提升档案管理的核心竞争力。
利用大数据,可以发现用户需求,统计需求量最高的项目,从而提供优质服务,提高档案利用者的满意度与忠诚度。同时应注重对科技档案的价值评价。
对科技档案的价值评价,应考虑技术因素、作者因素、史科因素和查考因素。同时,又将这些指标分为分指标;不同层次,如下所示。
科技档案水平技术因素科学意义创新程度经济效益作者因素著名专家合资项目科研单位史科因素科技发展自然界发展文物收藏查考因素经济活动科技决策科技干部考核实物结构查真 只有不同层次的考查才能使科技档案更具价值。
4.2建立农业科技档案数据库,注重数据挖掘
农业科技档案数据库是收集面向生态农业、信息农业、主体农业、微农业等方面的数据,集天下农业数据之大成。它能反映不同时间、不同地域、不同态势的农业信息。数据库能使原始记录更详细、更全面地反映农业科研活动的过程及其现实状况,能反映出历史变化,具备很高的准确性。
数据挖掘在农业科技档案管理中发挥着不可替代的作用。在数据库系统提供有效支持的前提下,数据挖掘利用人工智能和模式识别的思想,通过市场数据分析进行用户需求挖掘。及时调整粮食作物与经济作物的种植比例,及时发布农业病虫害的预防及处理信息。对农业生产进行控制监测,尽力减少农业成本,减少自然灾害给农业带来的损失。同时对农产品利润进行最大化系统设计,力争让农业科研为农业生产和销售服务,为农民创收出谋划策,达到社会效益与经济效益双赢。
4.3利用运筹学来进行农业科技档案信息优化,保障档案安全
运筹学主要是利用统计学和数学模型等方法,寻找复杂问题中的最佳解答。可利用运筹学中组合优化问题进行档案信息优化(即在最优解存在的情况下,从有限个可行方案中选择最优方案),如利用组合优化中的背包问题,进行纸质档案材料的收集。
将存放纸质档案的档案材料柜看作是背包,待装入的档案具有不同的体积,以及不同的价值。成功的是经验,失败的是教训,都能给人提供借鉴。问题是选择哪些内容的档案装入柜中,能使价值最大,这里需要用到背包问题的数学模型。
·假设我们要从众多纸质档案中选择若干卷宗装满档案柜。
·若有n个不同的卷宗,对于卷宗j其体积为Wj,价值为Pj,W是档案柜承受的最大体积。
·背包問题就是在要在不超过档案柜承受体积的前提下,使装入档案柜的卷宗价值最大。
其数学模型为:
max∑nj=1PjXj
s.t∑nj=1WjXj≤W
Xj=0或1;j=1,2,……n
Xj=1, 卷宗j被选入0,其他
档案信息优化应以用户本位为准则,即当用户利益与单位利益发生冲突时,应当优先考虑个人利益。
在档案服务的过程中,可利用计算机听觉和计算机视觉技术,如“机器视觉、人脸识别、掌纹识别、专家系统、自动规划、智能控制、图像理解”等功能,依农业科技档案不同的密级规定,分层次设置不同的门槛,保障档案资料的安全。
综上所述,大数据、云计算和数据挖掘三大科技,为农业科技档案的收集和管理开辟了新的天地,为档案管理人员提升自身综合素质,提高工作效率指明了方向。用综合评价提升档案管理的价值链,用数据挖掘在数据库里发现宝藏,用运筹学将信息优化,用人工智能保障信息安全,达到绩效机制达到信息共享。力争在尽短的时间内,让我国的农业科技档案管理屹立于世界科技档案管理之林。
参考文献
[1]张淑芳.浅议“大数据”时代下的电子档案建设趋势[J].档案管理,2013,(6).
[2]邓爱华.大数据时代来临,你准备好了吗?[J].科技潮,2012,(9):55.
[3]王敬儒.我国农业信息化发展的瓶颈与应对策略思考[J].中国科学院院刊,2013,(5):337343.
[4]梁川,王文生,谢能付.农业信息资源上数据挖掘的应用[J].中国农学通报,2009,25(11):243247.
关键词:大数据;农业科技档案;管理
中图分类号:F49文献标识码:Adoi:10.19311/j.cnki.16723198.2017.32.031
1何为大数据
大数据是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过整合共享、交叉复用,形成的智力资源和知识服务能力。大数据的特点具有囊括各行各业的海量数据,查找所需数据时运算速度超快、指数型、对数型、超越型等数据类型冗繁数据的利用价值超高,既能进行回顾性统计分析,又能进行前瞻性预测。
大数据的核心是预测,通过对海量数据的分析来预测事情发生的可能性。大数据不关注定量的存在,而是致力于数据价值的深层挖掘和开发。
随着大数据时代的来临,数据已经成为人们生活中不可缺少的资源,数据可视为航空航天、经济金融、医疗教育、工业制造、农业信息等行业的资产。科研离不开数据为支撑,离开了数据则变为漫天打炸雷。
2何为农业科技档案
档案是一种原始信息,它具有真实可靠性。档案类型众多,内容复杂。其中之一的农业科技档案,就含文字和计算、图表和照片等二维资料,还包含实物和标本等三维材料。
农业科技档案本质上为农业信息。农业信息的特点为:受季节和气候的影响,具有强烈的地域性,土壤的酸碱度南北方差异大。它包含二维、三维等不同维度,富有立体感处于动态之中。因此,农业科技档案的内容很复杂。
在大数据背景下,我国农业正在逐步转向现代农业、数字农业与信息农业。农业科技档案正在成为具有科学价值和实用意义的农业信息资源。
3目前我國农业科技档案的现状
3.1档案信息缺乏连续性及完整性,管理模式单一
目前的农业科技档案,过于功利,且视野狭窄,仅将获重要成果的项目申报材料,项目工作总结,项目验收报告,项目成果鉴定,项目奖励证明等资料归档,而对倾注于大量人力物力,掌握了众多真实数据,但由于种种原因导致失败的项目资料不予归档。不仔细分析原因,认识不到失败的项目亦存在重大的研究价值,无视前车之鉴、后车之师之理,存喜不存忧,收集档案的视野缺乏完整性。
农业科研因受自然条件和生态系统的影响,农业科研档案的形成周期长,干扰因素多,收集难度大,导致收集的内容易缺乏连续性。
正由于缺乏完整性及连续性,在利用档案进行分析统计时,可能出现奇点,找不到极值点(即最优解)。这将直接影响其价值信息的分析和利用。
现阶段,农业科技档案载体仍然以纸质为主,虽说有少量的资料储存于计算机上,但缺乏数据分析及数据挖掘缺乏安全屏障。随着农业由“平面式”向“立体式”发展,由“农场式”向“公园式”发展,由“自然式”向“设施式”发展,农业科研内容不断增多,便于携带的纸质二维图和三维图颇受人们青睐,采摘体验效果图,设施布局景观图颇受人们追捧,这样必将导致纸质档案所需存储空间越来越大,传统的单纯纸质档案的管理显然跟不上时代的步伐。
3.2档案管理服务缺乏共享机制
过去的档案工作是你需要什么,我帮你查找什么,其余不管。档案工作人员决不越雷池半步。这种模式即将被时代抛弃。
在大数据时代,档案管理人员应扮演信息专家的角色。应能根据用户需求,依系统论、信息论、控制论、耗散结构轮的思想,利用数理统计、数据挖掘、排队分析等工具,快速寻找出有价值的信息满足用户,同时还应具备三种能力。 “一是具备数学知识为数据集构模;二是具备过程技能建成数据模型分析系统;三是发现见解,从数据中讲出故事来”。不仅如此,档案管理人员还应熟悉本单位的业务,能以市场为导向,以效益为准则,给本单位提出科研建议,让科研更接地气,让科研活动发出勃勃生机。
4大数据背景下农业科技档案的管理
近年来,有学者提出了“加快云计算与大数据处理技术研究与农业应用,开发农业大数据库管理系统”的建议。亦有学者提出了农业数据挖掘系统的构建方案,对于通过数据技术来进一步提升农业信息服务水平具有一定意义。
这些已说明学者们已经察觉到高科技在农业中的作用,已肯定了大数据是农业科研不可或缺的平台。认识到只有依靠高科技手段,运用大数据储存,运用云计算处理,运用数据挖掘发现,才能解决农业科研中的农业信息资源的问题。农业科技档案是农业信息资源,如何在大数据背景下进行农业科技档案管理是亟待解决的问题。
4.1提升档案管理的“价值链”,注重科技档案价值综合评价
感知用户需求,拓展档案数据服务内涵,实施个性化农业科技档案管理。依据省部级、地级、县级不同的项目层次,提供不同的特色服务,形成不同的项目档案管理的“价值链”,即“收集、整理、分类、存贮、统计、保管、检索、汇编加工,开发利用”的综合体。
用动态生成的观点审视价值链,档案管理的每一个步骤都环环相扣,缺一不可。只有做好每一步的工作,才能使整个价值链熠熠生辉,同时,完善的价值链能提升档案管理的核心竞争力。
利用大数据,可以发现用户需求,统计需求量最高的项目,从而提供优质服务,提高档案利用者的满意度与忠诚度。同时应注重对科技档案的价值评价。
对科技档案的价值评价,应考虑技术因素、作者因素、史科因素和查考因素。同时,又将这些指标分为分指标;不同层次,如下所示。
科技档案水平技术因素科学意义创新程度经济效益作者因素著名专家合资项目科研单位史科因素科技发展自然界发展文物收藏查考因素经济活动科技决策科技干部考核实物结构查真 只有不同层次的考查才能使科技档案更具价值。
4.2建立农业科技档案数据库,注重数据挖掘
农业科技档案数据库是收集面向生态农业、信息农业、主体农业、微农业等方面的数据,集天下农业数据之大成。它能反映不同时间、不同地域、不同态势的农业信息。数据库能使原始记录更详细、更全面地反映农业科研活动的过程及其现实状况,能反映出历史变化,具备很高的准确性。
数据挖掘在农业科技档案管理中发挥着不可替代的作用。在数据库系统提供有效支持的前提下,数据挖掘利用人工智能和模式识别的思想,通过市场数据分析进行用户需求挖掘。及时调整粮食作物与经济作物的种植比例,及时发布农业病虫害的预防及处理信息。对农业生产进行控制监测,尽力减少农业成本,减少自然灾害给农业带来的损失。同时对农产品利润进行最大化系统设计,力争让农业科研为农业生产和销售服务,为农民创收出谋划策,达到社会效益与经济效益双赢。
4.3利用运筹学来进行农业科技档案信息优化,保障档案安全
运筹学主要是利用统计学和数学模型等方法,寻找复杂问题中的最佳解答。可利用运筹学中组合优化问题进行档案信息优化(即在最优解存在的情况下,从有限个可行方案中选择最优方案),如利用组合优化中的背包问题,进行纸质档案材料的收集。
将存放纸质档案的档案材料柜看作是背包,待装入的档案具有不同的体积,以及不同的价值。成功的是经验,失败的是教训,都能给人提供借鉴。问题是选择哪些内容的档案装入柜中,能使价值最大,这里需要用到背包问题的数学模型。
·假设我们要从众多纸质档案中选择若干卷宗装满档案柜。
·若有n个不同的卷宗,对于卷宗j其体积为Wj,价值为Pj,W是档案柜承受的最大体积。
·背包問题就是在要在不超过档案柜承受体积的前提下,使装入档案柜的卷宗价值最大。
其数学模型为:
max∑nj=1PjXj
s.t∑nj=1WjXj≤W
Xj=0或1;j=1,2,……n
Xj=1, 卷宗j被选入0,其他
档案信息优化应以用户本位为准则,即当用户利益与单位利益发生冲突时,应当优先考虑个人利益。
在档案服务的过程中,可利用计算机听觉和计算机视觉技术,如“机器视觉、人脸识别、掌纹识别、专家系统、自动规划、智能控制、图像理解”等功能,依农业科技档案不同的密级规定,分层次设置不同的门槛,保障档案资料的安全。
综上所述,大数据、云计算和数据挖掘三大科技,为农业科技档案的收集和管理开辟了新的天地,为档案管理人员提升自身综合素质,提高工作效率指明了方向。用综合评价提升档案管理的价值链,用数据挖掘在数据库里发现宝藏,用运筹学将信息优化,用人工智能保障信息安全,达到绩效机制达到信息共享。力争在尽短的时间内,让我国的农业科技档案管理屹立于世界科技档案管理之林。
参考文献
[1]张淑芳.浅议“大数据”时代下的电子档案建设趋势[J].档案管理,2013,(6).
[2]邓爱华.大数据时代来临,你准备好了吗?[J].科技潮,2012,(9):55.
[3]王敬儒.我国农业信息化发展的瓶颈与应对策略思考[J].中国科学院院刊,2013,(5):337343.
[4]梁川,王文生,谢能付.农业信息资源上数据挖掘的应用[J].中国农学通报,2009,25(11):243247.