软件开发过程数据池的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:yeximajor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建立一个大样本的软件开发过程数据资源池,可以回答软件工程学,甚至是社会学、组织学中许多的经典问题。本文设计与实现了一个软件开发过程数据池,为软件开发过程方面的研究提供数据基础。   开源软件项目经过长时间的发展,涌现出了很多成功的项目,如Apache和Firefox,又因为其数据的开放性,因此其开发模式是众多研究者的研究对象,本文建立的软件开发过程数据池主要针对开源软件项目。软件开发过程数据一般包括三种类型:缺陷数据、邮件数据和代码变迁数据,每种类型数据又有多种存在方式,这些数据具有数据量大、存储数据的系统类型多和数据持续更新等特点。   数据池按照功能分为:数据抓取、数据抽取、数据存储和数据接口,每个功能实现为一个模块。为了实现快速抓取,本文设计与实现了两个文件下载工具P-Loader和D-Loader,来辅助数据抓取;为了方便数据管理,采用了数据层次存储架构;为了实现数据的快速检索,采用键值数据库存储抽取后的数据;为了方便用户使用数据池中的数据,采用了可配置的数据接口。   本文首先抓取和抽取了四个有较大影响力的开源社区的开发过程数据。分别为Apache,Jboss,Gnome和Mozilla。并在逐步扩展范围,力求建成一个更加广泛的软件开发过程数据池。
其他文献
图像分割是图像分析、识别和理解的基础,是图像技术研究的热点和焦点,其分割结果的好坏直接影响到图像分析的质量。由于各种因素的影响,图像本身存在不确定性和不精确性,而模糊理
移动Ad Hoc网络是由一组带有无线收发设备的移动节点组成的一个多跳的临时性自组织网络,网络中的节点能够以任意可能的速度和移动模式自由移动,也可以随时开机和关机,自身发
近几年,随着计算机图形硬件性能的飞速提升以及图形学技术的发展,群组动画技术带来的震撼视觉效果和逼真画面越来越多地应用于人们的日常生活中。  群组行为模拟可以分成智能
两轮自平衡电动车是一种新能源、小型化、智能化的个人交通工具,同时也是一个多变量、强耦合、高阶的、非线性的一个倒立摆控制系统,为研制高性能、低成本的两轮自平衡电动车
粒子群优化算法作为群体智能优化算法的一种,源于对鸟群和鱼群群体运动行为的研究。它的主要特点是原理简单、参数少、收敛速度较快。该算法在函数优化、神经网络训练、组合
在信息社会里,计算机网络已经成为日常生活最重要和最频繁的通信媒介,人们可以从其中获得大量的信息资源和服务;另一方面,计算机网络中充斥着信息安全隐患,有关网络安全受到
网络作为获取信息的主要路径之一,人们对它的依赖程度也在与日剧增。然而,网络中存在的越来越多的入侵行为,给人们的日常生活带来了困扰,甚至会造成巨大的经济损失、威胁到国
本文主要针对图像分割问题进行研究,通过广泛的算法对比,选择使用人工鱼群算法(Artificial Fish Swarm Algorithm,AFSA)完成图像边缘检测,结合模糊C均值聚类算法完成图像分割
图像恢复技术在航空航天、物理材料、人工智能、控制理论和人们娱乐生活等诸多领域有着广泛而深刻的应用。在数字图像的拍摄过程中,由于成像系统的精密性,传输媒介的畅通性,
随着计算机应用的深入和软件工程的发展,软件系统与其它系统一样,其自身也会逐渐老化,不再适应用户和环境的需要而变成遗产系统(legacy system)。软件演化已经成为了软件生命