论文部分内容阅读
随着核心种质研究工作的开展、新理论的不断完善和大量种质数据的挖掘,使用什么样的取样策略,确定核心种质的数量规模,仍然是作物核心种质研究中遇到的最大难题。核心种质的遗传多样性及有效性检验等问题日益影响种质工作的进一步开展。本研究引入人工智能的方法来解决目前面临的这些难题,这对植物遗传资源核心种质的发展具有深远的意义。同时可以加速目前核心种质主要由人工进行的研究过程。主要研究内容和结果如下:本研究利用国家种质资源数据库、中国稻种资源数据和中国稻种资源初级核心种质的评价鉴定数据等材料作为研究对象。首先研究分析Excel、FoxPro、access和文本数据等多变、不统一的数据来源,比较了常用的几种异构数据库数据处理方法,提出了基于原生的ADO技术的异构数据库的统一访问和数据处理方法,此方法相比较具有高效、灵活的特点。用Delphi7和ADO2.0编程实现了异构数据库导出导入以及对多种数据库的访问。
构建了种质数据知识库、种质字段规范知识库、核心种质分组知识库、取样策略知识库、核心种质应用和推广知识库等知识库,用产生式知识表示法和脚本表示法来表示知识内容。
核心种质的取样策略,应用多种分组方法、多种核心种质取样算法和常用的几种组内取样比例的组合实现系统取样。
提出了混合性状的k-均值聚类算法,此算法可以针对不同属性性状分别进行相应的遗传距离计算和聚类过程,可以有效利用和处理种质数据中的质量性状、数量性状和有序性状,提高了构建核心种质的效率。利用这种算法对中国稻种资源初级核心种质的3636份鉴定评价数据,按照10%的比例构建了一个水稻的核心种质,通过对核心种质库和原始群体的数量性状的方差、均值进行F检验和T检验、对极差和变异系数的比较,证明用这种方法构建的核心种质库可以代表原是群体的遗传多样性。
利用不同取样方法从2941份稻种资源材料组成的一个群体中按照5%的取样规模筛选核心库,通过比较其多样性指数、极差、平均数、变异系数和方差,引入了人工智能方法中的一种快速无人工干预的取样算法——-SOFM神经网络算法。并将此算法与目前常规的两种算法随机取样算法和系统聚类算法进行了比较探讨了各自的优缺点和取样的效果,结果表明使用SOFM的取样算法,是一种比较有效方便的算法,可以在实际中加以应用。
本研究对核心种质智能管理系统做了需求分析,提出了系统的主要功能并设计了系统的各个功能模块,包括种质数据库管理、数据转换、信息查询与分析、核心种质取样、取样结果的统计分析和系统帮助等。最后,实现了水稻种资源核心种质智能管理系统。