基于密度聚类算法和等距离映射预测蛋白质功能模块算法的研究

来源 :南宁师范大学 | 被引量 : 0次 | 上传用户:beanmilk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一个生命体内所有蛋白质之间的相互作用形成了蛋白质相互作用(Protein-Protein Int eraction,PPI)网络,利用该网络可以识别与分析细胞环境中蛋白质分子的相互作用,以便深入理解蛋白质分子相互作用与执行功能的机制,帮助预测未知的蛋白质功能。智能优化算法在蛋白质功能预测研究领域已经得到深入研究,但是蛋白质功能预测的精确率、执行效率还有待提高,并且PPI网络中各种数据噪声影响也是一个问题。聚类算法是智能优化算法在蛋白质功能预测研究中的重要部分,因此本文通过研究已有基于PPI网络的聚类算法,深入了解各种聚类算法的优缺点,然后针对当前存在问题,提出基于密度聚类算法和等距离映射的蛋白质功能模块预测算法。本文所做主要工作如下所述。(1)基于PPI网络的聚类算法分类及比较。本文根据PPI网络的特征属性将其划分为基于PPI网络的单元聚类算法和基于PPI网络的多元聚类算法。根据蛋白质功能模块检测算法涉及单个蛋白质元素特征或考虑多个蛋白质特征本文把这些聚类算法分为单元聚类算法和多元聚类算法。单元聚类算法是逐个考虑每个蛋白质元素的特征,再对数据进行聚类;多元聚类算法是同时考虑多个蛋白质元素特征,综合多个特征进行聚类,从而得到不同的簇。(2)近些年来密度聚类算法广泛应用到蛋白质功能模块预测中,传统的密度聚类算法存在聚类精确度低和执行效率低的问题,首先对密度聚类算法进行改进,对PPI网络中低密度局部节点区域搜索能力进行改进,该算法对PPI网络进行聚类,获得其蛋白质功能模块的簇。密度聚类算法每次聚类时从局部最大密度数据出发进行聚类分析,最后获得蛋白质功能模块。(3)由于聚类分析后所获得的蛋白质簇维数过高,影响最终蛋白质功能模块预测的结果。针对这一个问题,对等距映射降维算法进行改进。根据局部线性原理,利用任意簇的图形建立矩阵;利用MDS算法获取高维数据的低维表示,使得降维后数据点之间保持高维数据点之间的测地线距离关系。最后完成高维到低维的数据处理。(4)针对目前预测蛋白质功能模块算法的精确率、执行效率及数据噪声问题,提出基于密度聚类算法和等距离映射的蛋白质功能模块预测算法。根据PPI网络中的核心节点、各节点位置、PPI网络结构这三个重要信息作为预测蛋白质功能模块的重要属性,使用上述改进密度聚类算法进行聚类分析,再使用上述改进等距映射降维算法对聚类后的数据进行主成份分析。然后利用多层感知器进行训练。最后对所提出的算法和现在几种主流预测蛋白质功能模块算法进行数据实验,实验结果表明所提出算法比当前主流算法在精确率、执行效及降低数据噪声方面均具有明显提高,表明所提出算法在改善这个三个指标方面是有效的。综上所述,针对目前智能算法在基于PPI网络的蛋白质功能预测研究领域存在的问题,本文通过对智能算法中的各种聚类算法进行比较研究,然后在此基础上提出基于密度聚类和等距离映射的蛋白质功能预测算法,数据实验表明该算法是有效的。基于PPI网络的蛋白质功能预测研究领域还有很多问题,还需要进行深入研究。
其他文献
给定有限群G及X ∈ Irr(G).称特征标对(H,θ)为X的诱导对,如果x=θG,此时称θ(1)为x的一个诱导次数.按整除关系定义x的诱导次数的所有极小元的集合为MDI(x).给定一个三元组τ
近十年来,随着无线传感器网络的应用,压电振动能量收集技术在实现无线传感器节点供能方面引起了广泛的研究兴趣。为了充分利用收集到的能量,需要通过接口电路对能量进行校正
传统的生产上料方式一般为人工上料,但这种上料方式已经不能满足快速生产的工业要求。如今工业机械手与机器视觉相结合的技术为工业生产上料过程开辟一个新方向,它能够直接或间接代替工人在生产线中对工件的取件、搬运和上料工作,从而提高入料环节的效率并节约大量人工成本。本文以层压机生产流水线工艺为背景,首先是对能源应用现状的简要介绍,明确当前光伏行业的趋势所在,并将工业机器人和机器视觉的现实发展、入料系统中关键
在科学研究和工程应用中,很多实际问题可转化为优化问题来求解。作为一类重要的优化工具,进化算法近年来受到了众多研究人员的密切关注。进化算法是一类模拟自然界中生物进化现象的启发式随机搜索算法,具有结构简单、性能优良、鲁棒性强的特点。与经典最优化算法相比,如:基于梯度信息的算法,进化算法对优化问题的数学性质要求不高,甚至可直接作为黑盒优化工具。因此,进化算法在很多实际优化问题中得到了广泛应用。近年来,随
面对世界经济波动,应对经济转向“高质量发展”模式,城市经济差异化发展,各城市经济增长方式转变,经济结构调整。人口流动是提高城市人力资本积累水平,调整城市人力资本结构,促进经济增长的重要途径,公共产品是地方政府对人口资源竞争的重要政策工具。面对经济转型机遇期,各城市经济发展动力和需求呈现差异化特征,探索人口流动、公共产品对经济增长的影响机制、传导机制,梳理分析各个城市经济发展的需求偏好,制定差异化公
染料敏化太阳能电池(DSSCs)作为新型太阳能电池的典型代表,因制备工艺简单、原材料来源广泛和环境友好等特点而在光伏领域中得到大量研究。Ti O2纳米颗粒薄膜已经被广泛应用于D
多金属氧簇化合物(Polyoxometalates,简称POMs),因其具有优良的氧化还原性和酸碱性的特性而备受关注,尤其在催化方面具有较好的发展前景。钒钼氧簇是POMs家族中的重要分支,本文以五氧化二钒、钼酸铵、硝酸银、硝酸镍、氯化铜等为原料,通过改变物料比、反应时间、反应温度以及有机配体的种类等,成功合成了15个钒钼氧簇化合物,并通过X-单晶衍射(SCXRD)、粉末衍射(PXRD)、红外光谱(
紫花苜蓿是营养价值丰富的优良牧草,为进一步研究内蒙古自治区紫花苜蓿干燥情况,本文采用红外和热风联合干燥的方式对紫花苜蓿进行干燥。红外干燥技术是目前比较新颖的一种干
在昆虫的繁衍进程中,鳞翅目两性昆虫间往往通过性信息素的精巧识别来实现其交配行为的调控—即新羽化的处女雌虫释放在空气中的性信息素分子,可被远距离的同种雄虫敏锐而准确
毛细管电泳(Capillary electrophoresis,CE)具有操作简单、分析速度快、分离效率高、溶剂消耗少、分离模式多等优点,在食品、药品、环境、生命科学等领域越来越受到人们的关注