基于Web程序的数据库语义发现方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:maomao11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着软件产业的发展,软件系统的规模和复杂度与日俱增,软件开发的很大一部分工作集中在维护和改造现有的软件系统上。以数据库为中心的遗产系统,例如信息管理系统,通常依赖于大量的数据库表。而由于缺乏完整清晰的文档,使得数据库维护人员难以理解数据库设计,不能准确把握数据库表中某些字段的语义。在以数据库为中心的Web应用程序中,程序代码可以是有关数据库字段的语义信息丰富的来源。然而,目前还很少有对以数据库为中心的Web应用程序进行分析来发现字段的语义的研究。   针对这一问题,本文提出了一种在以数据库为中心的Web应用程序中发现数据库字段语义信息的方法。该方法首先使用web信息抽取技术,对HTML代码进行分析,抽取出控件名称及其对应的描述信息。然后利用程序理解技术对后台代码进行分析,首先将后台代码生成系统依赖图,在此基础上对控件变量的数据流向进行分析,得到控件和数据库字段的对应关系。最后利用这两步的结果间接的发现了字段的语义信息。   最后,本文通过实验对提出的方法进行验证,通过准确率和召回率两个重要指标,证明了方法的正确性和有效性,同时也讨论了今后进一步研究和改进的方向。
其他文献
在医学CT中,过大的扫描剂量对被扫描病人是有害的。低剂量扫描的一种有效方法是仅仅扫描稀疏视角下的投影。然而,基于稀疏数据的解析法重建会产生严重的条状伪影,影响诊断。2
软件危机的爆发表明落后的软件生产方式已经无法满足社会和企业对计算机软件新的需求,而构件化软件开发技术被视为解决软件危机的有效方法,如同搭“积木”式组装和开发目标软件
随着信息化社会的发展,网络的不断普及,中文信息处理技术的应用越来越广泛。中文分词技术作为中文信息处理技术的基础,已经成为制约中文信息处理技术发展的一项关键和核心技术。
网格计算作为支持全球化资源共享与协作的关键技术,具有广泛的应用前景。在网格环境中,资源的动态性、异构性、自治性等特点致使网格用户很难获得高质量的服务,网格系统通常
随着分布式应用系统在各领域担当越来越重要的角色,对分布式系统的安全也提出了更高的要求。在分布式系统容灾技术中,本文中对其中担负重要任务的故障检测技术进行了研究。在
图聚类作为从海量数据中发现有用知识的技术引起了人们的广泛关注。目前的聚类方法多是在基于图拓扑结构或基于图节点属性方面进行研究,而在某些实际应用中需要同时考虑图节点
近二十年来,随着科学技术的发展,人们产生和收集数据的能力迅速提高,数据的规模急剧增加,数据的复杂性、异构性、动态性显著提高。传统的统计分析技术已无法满足现代数据处理的要
如今随着计算机的发展,数据作为企业的重要资源越来越受到重视,为了防止各种灾难对数据造成的损坏或者摧毁,建立起一个可以保证数据安全和服务连续性的容灾系统具有十分重要的意
随着复杂网络理论研究的不断深入及在各领域的应用,其所具有的社团结构特征吸引了广泛的关注。寻找和分析复杂网络的社团结构对于反映和理解整个网络的构成和功能有重要的意
棉纤维成熟度的自动判定是涉及图像处理、模式识别、计算机视觉等众多领域的综合性研究课题。传统棉纤维成熟度检测方法存在诸多弊端,随着计算机图像处理技术的不断发展,棉纤