论文部分内容阅读
随着第三次科技革命浪潮在中国不断的发展,中国各个公司单位的部门内公文流转过程越来越规范,不少单位建立起了OA系统,实现了自动化,无纸化,即高效率的单位内部文档流转。但是在整个企业OA系统的源头公司发文的岗位上,仍旧存在着发文效率低下,编制水平不高,反复发文的问题。本课题针对广大机关,事业单位的具体要求,利用企事业内部现有存储的非结构化的文本文件(主要是各个部门经常发布,流转的一些红头文件等)进行信息整理归纳,分类,从中提取相关格式,信息等素材,进行内容分析,自动分类,让使用者根据实际的权限,查看历史发文的内容,方便快速发布自己的文章,提高部门审批效率的目的。为了实现上述提出的目标,我对现在实现非结构化知识管理的方法进行了一系列调研得出如下结论:结合现在流行的全文搜索解决方案与课程中学习的数据挖掘的相关理论知识,可以实现一个企业内部发文相关的非结构化文档全文检索功能。借此功能,利用数据挖掘聚类的技术,结合分类关键词定义,实现文档标签动态分类功能,借助相关文档导出,查看等功能,让公司内文档拟定人员能够对其他部门的文档库进行方便的查询。系统将实现利用历史文档,针对部门新发文提供格式和内容实效性辅助的编写平台。本文的主要内容包括:论文背景和语义搜索技术发展综述,系统需求分析,系统概要设计和详细设计,系统测试,结论和展望等几个部分。搜索技术发展综述部分介绍了搜索的概念、发展和作用。论文研究背景与需求分析部分主要介绍了课题背景以及机关事业单位发文的种类以及发布过程。分析了部门发文的具体业务需求以及当前存在的主要问题,根据广大机关,事业单位发文系统的特殊性要求,做了详细的需求分析。在项目总体分析的理论学习后,本文比较仔细的说明了文档编写辅助的概要设计和详细设计。本文所研究的编写辅助系统采用B/S构架,研究内容包括服务器软件设计和数据库实现。包括登录认证模块,发文采集模块,文章采集模板,分类关键字设置模块,文章展现模块,数据结果输出模块等。针对文档辅助系统的各个子系统都给出了比较详细的设计。特别是针对在线编写,系统发文审批模块,本次研究给出了比较完整的实现。本文设计了针对搜索以及结果展现的黑盒测试用例,对整体系统进行了全面的功能和性能测试,并给出了测试结果。最后,对所设计的基于语义搜索技术编写的文档编写辅助系统进行了总结,提出了改进方向,作出了进一步研究方向的展望。