基于本体的群体软件工程关联数据自动构建

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:yaohaoyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
群体软件工程正成为云时代软件开发新模式,它利用群体开发力量和群体智能技术,快速构造规模庞大、功能复杂、技术创新的软件。然而群体协同开发面临大规模数据的挑战:几十万名开发人员、千万行代码、上千版本版次、大量的需求、设计模型、测试用例、缺陷、变更、任务、讨论记录和邮件等等,如何从这些分布异构的大规模数据中高效地知晓信息和发现知识成为了急需解决的问题。针对以上问题,本文将语义网引入软件工程领域,把这些多源异构数据进行细粒度语义关联,基于本体技术,自动构建包括需求、模块、代码、缺陷、提交、开发人员、邮件列表等核心实体的软件工程关联数据,为群体软件工程的信息智能搜索、数据挖掘、变更影响分析等提供有力的数据支撑。具体地,本文的贡献包括:1)软件工程本体的构建。采用基于映射的技术将来自不同数据源的结构化元数据直接映射生成初始本体,并进行本体融合,构建出软件工程领域本体。本文研究改进了基于映射的初始本体自动构建技术和本体融合技术。通过关系模式的抽取与合并,提高了映射生成的初始本体准确性;通过从本体概念命名、属性、关联和结构四个纬度识别相同或相似的本体概念并将其合并,从而得到完整有效的软件工程本体。采用eclipse.jdt、tomcat7和openssh开源项目进行对比实验,实验结果表明,和现有方法相比较,本文方法构建出的软件工程本体准确性更高。2)软件工程关联数据的抽取。本文采用了基于映射的技术,将各数据源中的结构化数据直接映射生成软件工程关联数据(即软件工程本体的实例),并利用实例消解技术和实例属性消歧技术进行清洗,解决存在的数据冗余和冲突问题。基于开源项目的对比实验表明,和现有方法相比较,本文方法能更有效地识别和处理抽取关联数据中的冗余和冲突,得到更有效的关联数据。3)软件工程关联数据的发现。基于同义词、动宾短语和结构关系三个特征,利用自然语言处理技术和信息检索技术从各数据源结构化与非结构化数据中发现潜在的或遗漏的关联关系,扩充关联数据。以两个开源项目和两个闭源项目为实验数据进行方法对比和特征对比实验,实验结果表明,本文方法发现的潜在关联数据在精准率和召回率上都高于现有其他方法,同时在三个特征中动宾短语对关联数据发现效率的提升最为明显。
其他文献
运用问卷调查,对全国知识分子健身活动的现状进行抽样调查,对他们的健身场所、形式、项目、动机、影响因素以及健身要求等进行比较分析,提出了发展我国知识分子体育健身活动
随着科技的进一步发展,越来越多的科技用于各个生产领域。本文研制的线型复合工具电化学-机械加工方法,结合了电化学和机械加工的优势,增加了电化学加工过程的可控性,使电化
通过分析新型材料中钛合金材料专利与非专利技术的现状与发展,尤其针对钛合金技术专利申请情况、关键技术引进状态、关键技术分布、重点专利等,提出了钛合金材料关键技术的引
应用经食道心房调搏方法观察心律平对房室旁道的电生理作用。结果显示:(1)心律平可明显延长房室旁道前向传导的有效不应期(ERP)。(2)对心房和房室传导系统ERP亦有延长作用。(3)可降低经旁道1:1下传
本文对广西大化透闪石玉的矿物学特征及矿床成因进行研究,通过研究其矿物组成、结构特征、谱学特征、地质成因及地球化学等方面,与其它产地透闪石玉进行对比,分析各产地之间
目的观察脊柱创伤患者围术期凝血功能及血小板的变化规律。方法选取2013年08月至2014年09月我院收治的脊柱骨折(ASAⅡ~Ⅲ级)患者55例,对患者手术前后的凝血时间(a PTT、PT、T
2019年新《个人所得税法》的出台是我国个人所得税历史上一次极为重要的改革,其大幅度的减税效果广泛惠及于中低收入阶层,尤其是对刺激中等收入者消费能力的提升具有重要意义。十九大报告明确提出要提高中等收入者的比重,这将是我国社会走向可持续发展道路的一个鲜明标志。个人所得税的减税有助于提高中等收入者的可支配收入,缩小高低收入者之间的收入差距,解决不平衡不充分的发展问题。基于此,深入研究个人所得税减税对中
目的:通过体外杀伤实验,比较LAK,A-LAK,CD3AK细胞对人小细胞肺癌细胞株LEPT-sml的杀伤活性。方法:利用脐带血制备LAK,A-LAK,CD33AK细胞,观察其增殖、细胞表面IL-2R表达、细胞表型改变及对LEPT-sml细胞的细胞毒作用。结果:A-LAK,CD3AK比LAK细胞具有更强
通过对健身运动处方教学与常规体育课教学效果的比较研究,认为健身运动处方教学符合科学的健身原理和规律,对增强学生体质有显著效果,证明运动处方教学模式在学校体育课中实施是