基于超图聚类的高血压基因芯片数据挖掘

来源 :青海师范大学 | 被引量 : 0次 | 上传用户:mn666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高血压是一种严重危害人类身体健康的心血管疾病,诱发高血压发病的因素众多,至今尚未完全阐明,在诱发高血压的众多因素中,由基因遗传引起的原发性高血压最主要的原因。近年来,由于基因芯片和DNA微阵列等高通量、短读取、低成本测试技术取得的巨大进展,因此出现了很多的基因组表达数据分析方法,这种基因组的数据分析方法可以揭示基因组活性,从基因的角度去探究一些疾病的发病机制。集成算法、聚类算法及加权基因共表达网络分析等众多分析方法在该领域的应用为分析大量基因数据提供了新途径。因此,我们需要更多的方法来研究高血压的发病机理,挖掘影响其发生的关键基因。随着基因芯片技术的不断发展和测序成本的降低,产生了大量的生物数据,这不仅给生物数据挖掘的研究带来了机遇,也带来了巨大的挑战。目前,高血压关键因子研究领域存在的主要问题是:原发性高血压复杂多变,诱发高血压的主要机制目前尚不明确;影响高血压发病率的重要因素尚不完全清楚。高血压病因复杂,诱发高血压的机制尚不清楚;影响高血压发生的关键因素尚未完全确定。因此,需要更多的研究方法来探索影响高血压发病率的关键因子。本文在以下几个方面进行了创新:(1)借鉴加权基因共表达网络的概念,与高血压基因相结合,构建了基于超图的加权基因表达超网络,以多个样本之间的共同的高表达基因作为超边,连接高血压基因表达样本。(2)分析传统聚类算法的不足,使用超图聚类的算法挖掘高血压致病基因,并对超图聚类算法进行了改进,对高血压基因样本数据中患病高血压基因进行挖掘,最后与传统聚类算法进行了聚类效果图的比对,同时引入了聚类效果评估指标进行比对。(3)对于超图聚类挖掘到的致病基因,设计了基于Ada Boost的高血压基因分类预测,判定分类患病高血压样本和正常的高血压样本,实现了准确有效的分辨高血压正常样本和患病高血压样本。本文研究的高血压基因数据来自于基因表达数据库(GEO)中,通过构建高血压基因表达超网络,提出超图聚类算法挖掘了与高血压相关的致病基因,对超图聚类算法进行了改进,并通过聚类效果可视化及聚类评估标准做了对比,证明了改进的超图聚类的聚类效果优于传统的聚类算法,设计了高血压疾病判定的强分类模型,对高血压样本进行了分类预测,准确率高达0.778。表明本文的方法可以挖掘出具有生物学意义的高血压致病基因,实现对致病高血压基因精准预测,对高血压分子机制的研究以及高血压临床医疗中的预防与治疗具有重要意义。
其他文献
电阻率法是地球物理勘探领域重要的组成部分,由于其自动化程度高、结果分辨率高等优点,普遍应用在环境污染调查、油气寻查、地质水文勘探等领域。电阻率法基于地层中电阻率参数的异质性,引入人工电场由研究区域电位分布特性分析地下介质参数特征。如果填埋场内发生渗滤液渗漏,渗滤液中存在的各类重金属等化学物质会使污染地区的电阻率出现明显改变,所以通过电阻率法获取、解析稳定电流场的分布特点可以达到检测填埋场污染扩散的
学位
含重金属危废(Heavy Metal Hazardous Wastes,HMHWs)产生量大、危害性强是全球固体废物管理的重点和难点。熔炼再生兼具无害化和有价金属回收利用双重效应,是HMHWs利用处置的主要方式。然而熔炼再生过程中,HMHWs中的有毒有害组分可能通过物质循环转化以尾气形式释放造成二次污染。现有研究主要关注熔炼过程正常工况下的达标排放及其环境效应和事故情景下的达标排放,对事故情景下的
学位
癫痫是一种常见的神经系统疾病,反复突然的癫痫发作给患者生活带来极大的影响,甚至给患者的身心健康造成严重的伤害。近年来,与癫痫诊断和治疗相关的技术研究受到各界的重视。为减少人工判读脑电图进行癫痫诊断的时间开销、提高癫痫检测效率,本文主要的研究工作如下。(1)提出一种基于双向门控循环单元神经网络的癫痫发作检测方法,即:在对长程多导联脑电图信号进行时频分解和特征提取的基础上,建立一种双向门控循环单元神经
学位
随着我国城市化进程加快,垃圾填埋场的数量也增长迅速。垃圾填埋场中普遍存在水分布区域不均和水位过高等问题,这对填埋场堆体稳定性造成严重影响,因此,开展填埋场水分布检测方法研究具有重要的现实意义。本文围绕填埋场中“找水”的问题,进行了填埋场水分布检测系统设计开发、现场测试和数据的算法反演,所做工作和成果如下:1、首先研究了电法勘探中电阻率法的相关知识,包括人工地电场的形成原理,静电场的基础理论公式,常
学位
近年来,人们的环保意识逐渐提升,国家的环保工作力度加大,虽然环境污染有所改善,但某些地区仍然存在空气污染严重的问题,这会给当地居民带来呼吸系统、心血管系统、神经系统等方面的危害。空气质量在线监测以及污染气体浓度的预测可以帮助人们进行有效的预防工作,让人们的生活环境变得更好。传统的空气质量监测系统一般都是对大城市和重点地区进行监测,存在监测设备体型较大、成本高和监测范围有限等问题。针对这些问题,本文
学位
随着人们生态保护意识逐渐增强,水资源问题得到了广泛的关注。通过合理的监测方式,快速精准地掌握水质变化数据,服务有关部门进行水质状况评估和治理,是对水资源进行科学保护的关键。然而,现有的水质检测方式往往依赖于大型水质分析设备,通过人工逐点采样后带回实验室进行精准分析,虽然得到的分析结果精度较高,但难以保证一定的时效性和时间连续性,面对复杂多变的取样环境,工作人员的操作难度大大提高,操作安全性也难以保
学位
随着网络规模的不断扩张和应用服务数量的迅猛增长,网络的运维和管理越来越困难。传统的设备厂商固守技术,使得网络设备配置复杂,网络升级和新业务部署困难,难以适应未来网络的发展趋势。软件定义网络(Software Defined Networking,SDN)的出现打破了这一僵局,SDN将控制和转发功能分离,实现了网络的可编程性和集中化的运维、管理。然而,SDN的结构和可编程性也带来了很多安全问题,控制
学位
视觉目标跟踪作为计算机视觉领域的热门问题之一,在跟踪目标的过程中,始终存在目标形变、背景复杂等困难。随着深度学习的发展与计算机硬件的增强,视觉目标跟踪不再局限于传统方法,转而利用深度网络提取更丰富的目标特征,构建更加鲁棒的表观模型,虽然一定程度上缓解了跟踪难度,但仍存在一些问题未能解决。本文从跟踪过程中容易忽略的难点出发,利用深度学习的方法对现有的目标跟踪算法进行了改进,分别在构建表观模型和缓解目
学位
探地雷达(Ground Penetrating Radar,GPR)是一种用于探测地下结构分布的电磁勘测技术。GPR采集的数据具有规模大、时空特性复杂和对勘测环境敏感等特点,其中时变结构模态是GPR数据中最有价值的信息,对了解地下结构分布起着非常重要的作用。但是,由于GPR数据中存在大量的噪声、杂波,导致传统的时变结构模态挖掘方法存在时间复杂度高、鲁棒性欠佳等问题。因而,提高时变结构模态挖掘过程的
学位
光伏发电因其具有保护环境、可再生的优势得到市场的认可,并被国家大力推广,因此得到快速的发展。在实践中,光伏发电系统输出的功率与当时的天气状况、设备运行状况等息息相关,并且随着时间和天气状况变化而出现波动性。随着大规模的光伏发电接入电网,电力系统的安全运行受到极大挑战。因此,实现对光伏发电功率的精准预测对优化机组启停计划,保障电网安全稳定运行具有重要意义。本文提出一种基于Elman神经网络、粗糙集属
学位