基于国家作物种质资源数据库的知识发现研究

来源 :中国农业科学院 | 被引量 : 0次 | 上传用户:yangnever
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国家作物种质资源数据库拥有180种作物、39万份种质信息、135万条记录,数据量达40GB,是世界上最大的植物种质资源数据库之一。利用知识发现(KDD)的原理、方法和技术发掘这些海量数据中蕴藏的信息,已成为当前作物信息科学研究的重要内容,对于充分发挥国家作物种质资源数据库的作用,更好地保护和利用我国丰富的作物种质资源具有十分重要的意义。本研究主要进行了以下两方面的研究。在分析国家作物种质资源数据库数据特点的基础上,提出了基于正态模拟的连续型数据缺失值处理方法以及基于随机数的离散型数据缺失值处理方法,并结合基于语义的离散化方法对国家作物种质资源数据进行了缺失值处理和离散化处理。研究分析了统计分析、决策树、关联规则、神经网络、遗传算法、模糊集、粗糙集等知识发现方法,结合国家作物种质资源数据库的特点,提出了基于关联规则的国家作物种质资源数据库知识发现方法。在此基础上,综合分析了现有的关联规则挖掘算法,重点分析了事务数据库中关联规则挖掘的经典算法—Apriori及其改进算法的特点,根据国家作物种质资源数据库中的关联规则具有多维性的特征,改进了Apriori算法,使其适用于多维关联规则挖掘,并提出了基于SQL的国家作物种质资源数据库Apriori关联规则挖掘方法。研究分析了国内外典型的知识发现系统,完成了国家作物种质资源数据库知识发现系统的总体设计,研制了国家作物种质资源数据库知识发现系统的原型。该系统接口简洁直观、易操作、挖掘结果易懂。在系统中设计了支持度过滤、置信度过滤、规则前件过滤及规则后件过滤等四种方法来精减规则数量。利用该系统,开展了大豆种质资源数据库的知识发现,初步获得了有关大豆种质资源农艺性状、品质、抗逆、抗病虫等特征特性的关联知识。
其他文献
应用双抗体ELISA夹心法检测禽类新城疫病毒(NDV)抗原,用单克隆抗体或多克隆抗体包被固相载体,将活化的40孔板作为捕捉待检新城疫病毒抗原,以辣根过氧化物酶(HRP)与单克隆抗体的结合物作为示踪抗体
合成生物学是以工程化设计思路,构建标准化的元器件和模块,改造已存在的天然系统或者从头合成全新的人工生命体系。人们利用基因重组技术和基因定位编辑来实现对生命系统的特
围绕烹饪专业现代学徒制人才培养研究,开展产教深度融合,发展校企紧密合作,进而探索烹饪专业人才培养模式,着眼于现代学徒制中“制”的突破。从育人体系、教学机制、运行模式
在我国几个不同版本语文教材的编排中,都借助图画训练小学生写话。以人教版一年级(上)语文教材为例,在每一个语文园地这一部分,固定的设有“习作”板块,主要由一幅幅精美、简
空腹网壳是根据格构式压杆的工作原理,将单层网壳的杆件用格构式压杆代替得到的一种形式新颖的网壳结构。它是平板模型空腹网架及空腹板架结构的曲面形式,既有良好的受力性能
胡枝子属(Lespedeza Michx.),是优良的水土保持和饲料型豆科灌木。有关胡枝子干旱生理、遗传改良等方面研究还处于空白阶段。本研究通过干旱胁迫实验,测定了胡枝子6个种的渗透
总结9例胃癌术后肺动脉栓塞患者的早期甄别和护理要点。通过密切观察胃癌术后患者呼吸困难、经皮氧饱和度下降或胸痛的临床表现,经D-二聚体、动脉血气氧分压、CTA等检验检查