论文部分内容阅读
近年来,随着软件产业的发展,软件系统的规模和复杂度与日俱增,软件开发的很大一部分工作集中在维护和改造现有的软件系统上。以数据库为中心的遗产系统,例如信息管理系统,通常依赖于大量的数据库表。而由于缺乏完整清晰的文档,使得数据库维护人员难以理解数据库设计,不能准确把握数据库表中某些字段的语义。在以数据库为中心的Web应用程序中,程序代码可以是有关数据库字段的语义信息丰富的来源。然而,目前还很少有对以数据库为中心的Web应用程序进行分析来发现字段的语义的研究。
针对这一问题,本文提出了一种在以数据库为中心的Web应用程序中发现数据库字段语义信息的方法。该方法首先使用web信息抽取技术,对HTML代码进行分析,抽取出控件名称及其对应的描述信息。然后利用程序理解技术对后台代码进行分析,首先将后台代码生成系统依赖图,在此基础上对控件变量的数据流向进行分析,得到控件和数据库字段的对应关系。最后利用这两步的结果间接的发现了字段的语义信息。
最后,本文通过实验对提出的方法进行验证,通过准确率和召回率两个重要指标,证明了方法的正确性和有效性,同时也讨论了今后进一步研究和改进的方向。