论文部分内容阅读
摘要:本文描述了基于物联网技术的智能档案管理软件系统,从体系结构、功能模块、关键技术等方面论述了该系统的特性。该系统包括档案录入、档案挂接、档案核验、档案背脊打印等功能模块。
关键词:人工智能 物联网 SOA
引言
在智能化档案管理系统上线后,实现了对营销业务流程流转中所产生的纸质档案及电子档案的管理。但是对于营销档案管理系统上线之前产生的历史档案,未能实现纸质档案的电子化管理[1][2]。为有效利用营销档案管理系统对历史档案进行管理,保障营销客户档案信息安全存储,提高营销档案的利用率和使用价值,需要将营销档案管理系统上前已经形成的历史档案进行整理、电子化,完成检查核对后整理入库,进行统一管理。历史档案电子化工作实现对既有历史档案的补录、整理和电子化,与已经上线营销档案管理系统相结合,实现电力客户档案的生成、收集、归档、更新等全过程与营销各项业务办理流程的紧密关联,及时收集、实时更新、动态监控,确保纸质档案与电子档案的逐一对应及档案内容的完整性、准确性与实时性。
本文按照国家电网公司营销档案管理规范的要求,为海量营销历史档案提供一套高效、便捷的电子化辅助解决方案,将电子档案纳入营销档案信息化管理范围内。在信息化的管理方式下,保证营销电子档案全生命周期的完整性、安全性,提高业务档案的数据共享,方便各个不同岗位的业务人员进行调阅,提高档案利用率;为营销业务办理提供支撑,显著提高了营销业务办理效率。
需求分析
历史档案电子化的业务需求主要包括:〖档案录入〗、〖档案挂接〗、〖档案核验〗、〖背脊打印〗等。总体流程图如下:
档案录入
本业务根据档案管理规范,确定营销业务办理过程中产生的各类资料的收集规则,确保资料收集的规范化、合理化、阶段化,具体包括供用电双方在各类用电活动中形成的纸质文书和电子文档,同时记录纸质资料交接信息。
根据《国家电网公司营销客户档案电子化管理规范》,按照业务要求,对资料及时进行电子文件封装和业务信息电子化。
该业务项主要包括初始化、模板管理、选择业务、档案封装。
档案挂接
本业务描述业务人员依据档案挂接规范,将按照指定格式整理好的资料文件和用户进行自动挂接。
档案核验
本业务描述历史档案管理人员在档案室及档案库房内对录入、挂接后的档案进行核对的过程,主要对档案库房内档案盒、档案袋、实体档案资料及对应的电子化档案信息进行核验查询、下达核验结论、查看核验记录等工作内容。
背脊打印
本业务描述档案电子化后纸质文件存放在档案库房内档案盒背脊处信息的打印功能,通过查询、打印等功能获取档案盒背脊信息并打印。背脊打印通过检索盒条码以及盒RFID后确认需要打印背脊的档案盒,展示档案盒背脊的相关信息如保管期限、档号、案卷题名、条码等信息。
性能需求
满足系统能够应对最大100注册用户,最大在线用户50人,高峰并发用户30人的应用需求,满足系统设计的整体性能以及稳定性需求。
系统设计
总体架构
历史档案应用将业务中产生的基础数据和收集的电子化资料在核准前放在历史档案平台,在核准后被推送到非结构化数据管理平台和营销营销档案管理系统。历史档案管理应用所需的组织机构、人员信息等基础数据需要从营销基础数据平台中复制。总体架构如下:
关键技术
按照历史档案系统的应用架构和数据架构的设计,结合当前的技术要求和信息技术发展趋势,历史档案应用系统采用技术先进性与成熟性相结合的J2EE的多层技术架构,以提高系统的灵活性、可扩展性、安全性以及并发处理能力;采用国网公司应用系统统一开发平台SG-UAP,基于该平台进行上层应用功能的开发;同时,在集成设计方面,采用基于SOA的架构策略,实现与企业内部业务应用系统、企业外部系统的集成[3][4][5][6]。
历史档案系统应用中涉及到大量非结构化数据的收集、存储、管理、维护,关于非结构化电子档案的处理有三个技术关键点:
异步并发存储技术
电子文件、音视频文件占用带宽较大,限制上传带宽的情况下传输时间较长,需要通过异步处理上传与续传,并对多个终端的并发上传任务能够进行排队处理。利用消息排队机制与文件缓冲机制处理文件上传时的异步并发问题。
智能文本识别技术
图像文本识别技术是指高拍仪/扫描仪等终端设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程:即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是该技术的重点。
智能搜索技术
智能搜索引擎是以营销业务数据资源和业务分类为基础,对其进行采集、组织、存储、利用,实现营销档案的索引库以及丰富的搜索手段,搭建营销全方位搜索引擎。实现人工和定时自动从历史档案应用数据库和非结构化数据管理平台中获取数据,建立文档采集库和应用链接库,并形成索引文档,由搜索引擎对索引文档的内容进行过滤、整合、分割、分类保存形成企业的索引文件库。提供一套统一可靠的检索入口,通过模糊匹配、全文搜索、高速索引等技术搭建搜索引擎,提供精确的搜索定位。
功能模块设计
通過对历史档案应用的各项业务分析及应用功能的梳理,提炼出具体的功能主题及应用功能模块,根据应用架构的设计方法及标准,设计满足历史档案的总体应用功能蓝图。
应用功能蓝图主要包括档案录入、档案挂接、档案核验、工作统计4个功能模块:
本业务根据档案管理规范,确定营销业务办理过程中产生的各类资料的收集规则,确保资料收集的规范化、合理化、阶段化,具体包括供用电双方在各类用电活动中形成的纸质文书和电子文档,同时记录纸质资料交接信息。根据《国家电网公司营销客户档案电子化管理规范》,按照业务要求,对资料及时进行电子文件封装和业务信息电子化。该业务项包括【初始化】、【模板管理】、【选择业务】、【档案封装】。 档案挂接
业务人员依据档案挂接规范,将按照指定格式整理好的资料文件和用户进行自动挂接,并通过OCR识别将电子化文档数据抓取存入相关的数据库中。包括【自动挂接】、【OCR识别】业务子项。
档案录入完成
档案核验
本业务描述历史档案管理人员在档案室及档案库房内对录入、挂接后的档案进行核对的过程,主要对档案库房内档案盒、档案袋、实体档案资料及对应的电子化档案信息进行核验查询、下达核验结论、查看核验记录等工作内容。包括【档案核验】、【查看核验记录】两个业务子项。
档案挂接完成
工作统计
本业务描述档案电子化后过程中,为了统计各个实施业务人员或工作小组的实际工作量以及在工作过程中收集的相关信息。包括【工作统计】子项。
历史档案管理应用与周边系统的集成包括数据集成、应用集成以及界面集成等三种类型,总体集成关系如下图所示。
圖3
1)与营销基础数据平台进行数据集成,历史档案应用通过JDBC数据库访问方式或WebService服务调用方式获取基础数据;
2)与营销档案业务应用之间进行界面集成,在营销档案业务应用中集成页面清单。
3)与营销档案业务应用通过WebService方式实现应用集成;
4)通过调用非结构化数据管理平台提供的接口实现已归档非结构化数据的存储等功能;
5)向营销电子文件系统推送受控电子文件;
6)与统一权限平台进行应用集成,通过SG-UAP集成统一权限管理平台实现身份鉴别、组织机构管理、权限控制、访问控制;
7)与工作流平台进行应用集成,通过SG-UAP集成业务流程管理平台,支撑业务流程相关应用功能;
8)与IT运维管理系统(IMS)界面集成,通过集成IMS的监控页面实现对历史档案应用运行状况的在线监视;
9)与IT运维管理系统(IMS)进行应用集成,调用IMS的WebService数据采集接口向IMS上传系统运行状态数据,
物理部署方案
历史档案应用的物理架构视图,分为生产环境和测试培训环境两部分,其中测试培训环境可用于现场测试、仿真、用户培训。
历史档案应用生产环境构成情况如下:
1)配置一台磁盘阵列,用于提供历史档案管理的结构化数据存储、未归档电子文件的短期存储;
2)配置2台光纤交换机,组成HA模式,与磁盘阵列组成SAN网络;
3)配置2台PC服务器作为数据库服务器,组成ORACLE 11.2.0.4+ASM+RAC模式,提供结构化数据管理功能;
4)配置多台PC服务器,部署WEBLOGIC 11G,构成应用服务器集群,承担Web应用服务。
5)配置2台负载均衡器组成HA模式,用于提供应用负载均衡访问;
结语
本文详细描述了营销历史档案电子化管理应用软件系统设计与开发全过程。该软件系统目前已基本开发完毕,并在河南等省营销档案管理应用中得到了实践检验,系统性能满足需要,功能配置完善灵活,得到了用户的一致好评。
参考文献
软件导刊,2009年8 月第8卷第8期,《电力营销客户档案管理系统设计与开发》,吴喜萍,段凡丁
农村电气化,2010年第12期,《电力营销客户档案管理系统的开发与应用》, 张学政
《GB/T 8567-2006 计算及软件文档编制规范》
《GB/T 5271.1—2000 信息技术》
《GB/T 11457-2006 软件工程》
《GA/T 387-2002 计算及信息系统安全等级》
关键词:人工智能 物联网 SOA
引言
在智能化档案管理系统上线后,实现了对营销业务流程流转中所产生的纸质档案及电子档案的管理。但是对于营销档案管理系统上线之前产生的历史档案,未能实现纸质档案的电子化管理[1][2]。为有效利用营销档案管理系统对历史档案进行管理,保障营销客户档案信息安全存储,提高营销档案的利用率和使用价值,需要将营销档案管理系统上前已经形成的历史档案进行整理、电子化,完成检查核对后整理入库,进行统一管理。历史档案电子化工作实现对既有历史档案的补录、整理和电子化,与已经上线营销档案管理系统相结合,实现电力客户档案的生成、收集、归档、更新等全过程与营销各项业务办理流程的紧密关联,及时收集、实时更新、动态监控,确保纸质档案与电子档案的逐一对应及档案内容的完整性、准确性与实时性。
本文按照国家电网公司营销档案管理规范的要求,为海量营销历史档案提供一套高效、便捷的电子化辅助解决方案,将电子档案纳入营销档案信息化管理范围内。在信息化的管理方式下,保证营销电子档案全生命周期的完整性、安全性,提高业务档案的数据共享,方便各个不同岗位的业务人员进行调阅,提高档案利用率;为营销业务办理提供支撑,显著提高了营销业务办理效率。
需求分析
历史档案电子化的业务需求主要包括:〖档案录入〗、〖档案挂接〗、〖档案核验〗、〖背脊打印〗等。总体流程图如下:
档案录入
本业务根据档案管理规范,确定营销业务办理过程中产生的各类资料的收集规则,确保资料收集的规范化、合理化、阶段化,具体包括供用电双方在各类用电活动中形成的纸质文书和电子文档,同时记录纸质资料交接信息。
根据《国家电网公司营销客户档案电子化管理规范》,按照业务要求,对资料及时进行电子文件封装和业务信息电子化。
该业务项主要包括初始化、模板管理、选择业务、档案封装。
档案挂接
本业务描述业务人员依据档案挂接规范,将按照指定格式整理好的资料文件和用户进行自动挂接。
档案核验
本业务描述历史档案管理人员在档案室及档案库房内对录入、挂接后的档案进行核对的过程,主要对档案库房内档案盒、档案袋、实体档案资料及对应的电子化档案信息进行核验查询、下达核验结论、查看核验记录等工作内容。
背脊打印
本业务描述档案电子化后纸质文件存放在档案库房内档案盒背脊处信息的打印功能,通过查询、打印等功能获取档案盒背脊信息并打印。背脊打印通过检索盒条码以及盒RFID后确认需要打印背脊的档案盒,展示档案盒背脊的相关信息如保管期限、档号、案卷题名、条码等信息。
性能需求
满足系统能够应对最大100注册用户,最大在线用户50人,高峰并发用户30人的应用需求,满足系统设计的整体性能以及稳定性需求。
系统设计
总体架构
历史档案应用将业务中产生的基础数据和收集的电子化资料在核准前放在历史档案平台,在核准后被推送到非结构化数据管理平台和营销营销档案管理系统。历史档案管理应用所需的组织机构、人员信息等基础数据需要从营销基础数据平台中复制。总体架构如下:
关键技术
按照历史档案系统的应用架构和数据架构的设计,结合当前的技术要求和信息技术发展趋势,历史档案应用系统采用技术先进性与成熟性相结合的J2EE的多层技术架构,以提高系统的灵活性、可扩展性、安全性以及并发处理能力;采用国网公司应用系统统一开发平台SG-UAP,基于该平台进行上层应用功能的开发;同时,在集成设计方面,采用基于SOA的架构策略,实现与企业内部业务应用系统、企业外部系统的集成[3][4][5][6]。
历史档案系统应用中涉及到大量非结构化数据的收集、存储、管理、维护,关于非结构化电子档案的处理有三个技术关键点:
异步并发存储技术
电子文件、音视频文件占用带宽较大,限制上传带宽的情况下传输时间较长,需要通过异步处理上传与续传,并对多个终端的并发上传任务能够进行排队处理。利用消息排队机制与文件缓冲机制处理文件上传时的异步并发问题。
智能文本识别技术
图像文本识别技术是指高拍仪/扫描仪等终端设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程:即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是该技术的重点。
智能搜索技术
智能搜索引擎是以营销业务数据资源和业务分类为基础,对其进行采集、组织、存储、利用,实现营销档案的索引库以及丰富的搜索手段,搭建营销全方位搜索引擎。实现人工和定时自动从历史档案应用数据库和非结构化数据管理平台中获取数据,建立文档采集库和应用链接库,并形成索引文档,由搜索引擎对索引文档的内容进行过滤、整合、分割、分类保存形成企业的索引文件库。提供一套统一可靠的检索入口,通过模糊匹配、全文搜索、高速索引等技术搭建搜索引擎,提供精确的搜索定位。
功能模块设计
通過对历史档案应用的各项业务分析及应用功能的梳理,提炼出具体的功能主题及应用功能模块,根据应用架构的设计方法及标准,设计满足历史档案的总体应用功能蓝图。
应用功能蓝图主要包括档案录入、档案挂接、档案核验、工作统计4个功能模块:
本业务根据档案管理规范,确定营销业务办理过程中产生的各类资料的收集规则,确保资料收集的规范化、合理化、阶段化,具体包括供用电双方在各类用电活动中形成的纸质文书和电子文档,同时记录纸质资料交接信息。根据《国家电网公司营销客户档案电子化管理规范》,按照业务要求,对资料及时进行电子文件封装和业务信息电子化。该业务项包括【初始化】、【模板管理】、【选择业务】、【档案封装】。 档案挂接
业务人员依据档案挂接规范,将按照指定格式整理好的资料文件和用户进行自动挂接,并通过OCR识别将电子化文档数据抓取存入相关的数据库中。包括【自动挂接】、【OCR识别】业务子项。
档案录入完成
档案核验
本业务描述历史档案管理人员在档案室及档案库房内对录入、挂接后的档案进行核对的过程,主要对档案库房内档案盒、档案袋、实体档案资料及对应的电子化档案信息进行核验查询、下达核验结论、查看核验记录等工作内容。包括【档案核验】、【查看核验记录】两个业务子项。
档案挂接完成
工作统计
本业务描述档案电子化后过程中,为了统计各个实施业务人员或工作小组的实际工作量以及在工作过程中收集的相关信息。包括【工作统计】子项。
历史档案管理应用与周边系统的集成包括数据集成、应用集成以及界面集成等三种类型,总体集成关系如下图所示。
圖3
1)与营销基础数据平台进行数据集成,历史档案应用通过JDBC数据库访问方式或WebService服务调用方式获取基础数据;
2)与营销档案业务应用之间进行界面集成,在营销档案业务应用中集成页面清单。
3)与营销档案业务应用通过WebService方式实现应用集成;
4)通过调用非结构化数据管理平台提供的接口实现已归档非结构化数据的存储等功能;
5)向营销电子文件系统推送受控电子文件;
6)与统一权限平台进行应用集成,通过SG-UAP集成统一权限管理平台实现身份鉴别、组织机构管理、权限控制、访问控制;
7)与工作流平台进行应用集成,通过SG-UAP集成业务流程管理平台,支撑业务流程相关应用功能;
8)与IT运维管理系统(IMS)界面集成,通过集成IMS的监控页面实现对历史档案应用运行状况的在线监视;
9)与IT运维管理系统(IMS)进行应用集成,调用IMS的WebService数据采集接口向IMS上传系统运行状态数据,
物理部署方案
历史档案应用的物理架构视图,分为生产环境和测试培训环境两部分,其中测试培训环境可用于现场测试、仿真、用户培训。
历史档案应用生产环境构成情况如下:
1)配置一台磁盘阵列,用于提供历史档案管理的结构化数据存储、未归档电子文件的短期存储;
2)配置2台光纤交换机,组成HA模式,与磁盘阵列组成SAN网络;
3)配置2台PC服务器作为数据库服务器,组成ORACLE 11.2.0.4+ASM+RAC模式,提供结构化数据管理功能;
4)配置多台PC服务器,部署WEBLOGIC 11G,构成应用服务器集群,承担Web应用服务。
5)配置2台负载均衡器组成HA模式,用于提供应用负载均衡访问;
结语
本文详细描述了营销历史档案电子化管理应用软件系统设计与开发全过程。该软件系统目前已基本开发完毕,并在河南等省营销档案管理应用中得到了实践检验,系统性能满足需要,功能配置完善灵活,得到了用户的一致好评。
参考文献
软件导刊,2009年8 月第8卷第8期,《电力营销客户档案管理系统设计与开发》,吴喜萍,段凡丁
农村电气化,2010年第12期,《电力营销客户档案管理系统的开发与应用》, 张学政
《GB/T 8567-2006 计算及软件文档编制规范》
《GB/T 5271.1—2000 信息技术》
《GB/T 11457-2006 软件工程》
《GA/T 387-2002 计算及信息系统安全等级》