论文部分内容阅读
随着软件行业的发展,软件的需求量迅速增加且软件系统规模也日益扩大,越来越多的软件企业意识到软件复用的重要性。软件企业实施软件复用最有效途径是对企业自身的资产进行复用。可复用资产管理系统以对象管理组织(OMG)提出的可复用资产规约为理论依据,实现对企业内可复用资产的描述、存储和检索等功能。开发该系统时所面临的一个主要技术问题是如何检索系统中大量的资产,合理的资产检索方法能大大降低检索成本和理解成本,反之则会提升企业使用系统的难度,最终导致复用失败。文章结合国内软件企业的软件复用现状和企业的需求,确立了基于资产实体描述文件的关键词检索和领域刻面分类检索两种检索方法。它们分别适合企业实施可复用资产管理系统的初期和后期,能适应开发人员在软件复用经验上的成长变化。本文主要研究如何实现这两种检索方法,其中涉及对一些成熟的检索技术进行改进,并运用到可复用资产管理系统中,使检索功能更符合企业的需求。首先,本文对可复用资产规约进行研究,并实现了资产的实体描述文件,它是一种XML文档,包含了资产的元数据。在资产实体描述文件的<classification>元素中,实现了资产的关键词描述和领域刻面术语描述,这些描述信息用于建立资产的相关倒排索引,以提高资产检索效率。其次,文章详细阐述了利用传统信息检索技术对资产实体描述文件进行关键词抽取、编码和通过倒排索引实现关键词检索的过程。抽取关键词时,本文提出由人为指定资产的关键词序列以解决缺乏软件复用领域词典的问题,使用正向匹配算法实现资产实体描述文件的关键词抽取。为了使检索结果粒度更细,帮助用户获取资产中最相关的信息,本文研究对于某个查询关键词序列,如何利用Dewey编码查找资产实体描述文件树的关键词最小公共祖先结点。为了对检索结果进行排序,研究关键词与资产实体描述文件的相关度计算公式,并且从关键词的概率分布以及在描述文档中的位置两方面来衡量相关度。此外,本文对传统刻面模式进行了改进。在分析了传统刻面模式的不足后,提出基于FODA(面向特征的领域分析)的领域刻面分类模式,它将所有刻面分为三层,每一层的刻面组对应FODA的三个阶段:确定领域边界并建立边界模型、提取功能需求并建立特征模型和细化领域分析并建立架构模型。每一层中的刻面术语分别对应边界模型、特征模型和架构模型中的特征术语。实现领域刻面分类检索时,由于刻面术语之间存在一般/特殊关系,为了使术语与资产匹配时能体现这种关系,对刻面描述文件进行编码,并利用Dewey编码的特点判断术语的所有子术语、生成刻面匹配术语集合和计算术语权重。最后,详细介绍资产检索模块的设计与实现。以MVC模式中的模型实现资产检索模块,介绍实现这些模型的关键技术和核心代码。