领域驱动知识发现方法研究

来源 :大连理工大学 | 被引量 : 9次 | 上传用户:liongliong492
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一种常用的、从海量数据中获得潜在的、有用知识的发现过程,但传统的数据挖掘是以数据为驱动,强调挖掘过程的自动化,挖掘的结果中常常包括大量冗余、甚至错误的知识,无法直接应用于现实世界的实践活动。以挖掘用户感兴趣,可行动知识为目标的数据挖掘,需要将领域知识,特别是专家的偏好、经验、知识和智慧贯穿于整个挖掘数据过程中,变数据驱动的数据挖掘为领域驱动的数据挖掘,以弥补数据挖掘在学术研究与现实世界应用之间存在的鸿沟。另一方面,大量知识存在于人类载体中,特别是具有丰富理论与实践经验的领域专家,对于复杂问题的求解需要直接以领域专家为挖掘对象,获得群体专家对复杂问题的共识知识,并通过两种知识发现方式的相互补充、验证,从而能获更为全面、准确的知识。本文应用管理科学、计算机科学及综合集成方法论,以领域知识为驱动、数据与领域专家为挖掘对象研究获取用户感兴趣、可行动知识的方法,并将这种方法称为领域驱动知识发现,主要的研究内容包括:1、在分析传统数据挖掘存在不足的基础上,研究如何将领域知识贯穿到整个数据过程的方法,进一步丰富、充实领域驱动数据挖掘的相关理论。针对传统数据挖掘过程模型CRISP-DM存在的不足,提出一个新的领域驱动数据挖掘过程模型,并引入综合集成系统方法论指导领域驱动数据挖掘过程。2、提出一个基于语义的Apriori改进算法以实现将领域知识整合到挖掘算法中,以满足获取不同层次、不同目的的挖掘需求。3、研究如何在领域专家研讨获得专家的共识知识。在分析专家知识特点的基础上,建立专家知识模型,在对专家共识分析时,提出用对应分析方法从专家与专家意见两个维度同时进行聚类并在二维平面上进行映射,以挖掘专家之间,专家与意见之间的聚类知识,同时改进一个二分图网络投影压缩算法,并将其应用于计算专家的意见相似度中,以定量化方法描述专家意见的相似性和独立性。4、在上述理论研究的基础上,设计开发一个以领域知识为驱动知识发现平台,利用该平台分别从数据和专家两种知识载体为对象挖掘名老中医的学术思想,实证结果表明领域驱动知识发现方法的可行性及优势。
其他文献
工程造价的90%以上都耗用在施工阶段,因此,这一阶段的造价控制是整个工程造价控制的重要一环,要准确处理造价、工期和质量的辨证关系,把投入产出观念渗透到施工过程中,努力使
校史文化建设是时代发展的要求,也是高校发展的必然要求。随着高校的不断发展,校史文化对于学校更好地建设发展、更好地育人越来越凸显其重要意义,但还未得到足够的重视。探
目的:探讨RNA干扰技术沉默HSP70基因表达对人喉癌细胞株Hep-2生物活性的影响。方法:采用免疫组化SP染色方法检测6例声带白斑(声带白斑组)、6例喉乳头状瘤(喉乳头状瘤组)和7例声带
<正>以往研究表明,与随意运动有关的皮层区域主要包括初级运动皮层(primary motor cortex,MI) 和前运动皮层(premotor cortex,PMC)、辅助运动区(supplementary motor area,SM
会议
采用聚丙烯为过滤材料,通过改变褶皱过滤器的褶深度和褶间距,对褶皱过滤器的过滤效率和阻力进行测试,研究褶皱过滤器的结构与其过滤效率和阻力之间的关系。试验结果表明,在褶皱过
如何打造IT执行力和领导力?中国医药集团正尝试引入IT治理理念,营造“IT软环境”。
阅读是小学语文课程中极其重要的内容。在小学阶段,教师应关注学生的阅读能力,而以课本为载体的阅读量毕竟是有限的,有限的课本知识不足以满足学生的发展,在教学实践中,语文
利用川滇地区1991-1999年的高精度GPS观测处理结果,采用稳健 - 贝叶斯最小二乘算法与多断裂位错模型,分析研究了川滇菱形块体主要边界运动的定量模型.反演分析表明:川西鲜水
董仲舒的"三纲五常"思想作为中国封建社会道德体系的基本核心,对中国传统思想文化产生了深刻影响,具有极高的文化价值。"三纲五常"思想的正向文化功能体现在文化整合功能、文
肿瘤具有无限制性生长的特点,这依赖于新生血管不断提供营养,而影响肿瘤细胞促进血管新生的关键因素尚不清楚。基质金属蛋白酶(MatrixMetalloproteinase,MMP)是水解细胞外基质的蛋