论文部分内容阅读
随着科学技术的不断发展,生物分析仪器也在不断得到改良,微生物检测也从常规检测一步步过渡到分子生物学的检测其中大部分为DNA进行检测,纳米孔测序技术是新一代DNA检测技术,因此使用纳米孔检测微生物也成为了当今的前沿科技。本文主要利用纳米孔测序技术,使用FPGA等硬件作为仪器的搭建主体,使用智能算法对其进行分类,鉴定DNA种类,主要研究内容如下:首先,针对无法获取DNA原始电流的现象,从欧洲核苷酸档案馆中获取MinION设备的数据,并将事件信息重建成原始信号数据,利用MATLAB制成mif文件。分析了三种数字电路频率合成技术的优缺点,并从中选择了直接数字频率合成技术(DDS),用其设计了一套多通道的模拟数据生成设备,并将其作为本论文的实验数据来源。其次,使用ADC9226芯片设计了一套高速模数转换电路,并利用了FPGA编程将数据源产生的数据进行高频率采集,同时使用千兆以太网模块编写了一个不使用MAC IP核的UDP通讯模块,将采集到的数据转发至上位机,实验证明其工作速率的确可以达到千兆,可以满足对数据的实时采集。再次,对生物纳米孔测序原理进行了分析,并分析出其产生误差的两个根本原因。介绍了传统的碱基识别算法与特征提取方式。在此基础上,将脑电波处理领域中的Hjorth参数作为DNA原始信号数据的特征提取手段,并构建了全新的DNA种类识别分类器设计,利用这个分类器可以大幅度的减少计算复杂度和判断时间。最后,对多种人工智能分类器进行了阐述,并从中选取支持向量机分类器以及随机森林分类器对180组大肠杆菌和荧光假单胞菌测序数据进行了分类验证。同时使用了网格搜索、遗传算法、树形Parzen评估器算法(TPE)分别对两种分类器进行了超参数优化,将最终优化后的随机森林分类器绘制ROC曲线比较其性能,最终发现使用遗传算法和TPE算法优化的随机森林算法对这二者分类效果很好。同时利用多种软件完成仪器的最终验证。