【摘 要】
:
近年来,随着计算机技术的发展和生物大分子数据的爆发式增长,将数学理论、计算机算法应用到生物学研究当中的趋势越发明显,对机器学习算法预测蛋白质相互作用的研究也在逐年增多。在此背景下,本文研究了机器学习的一个重要分支——神经网络在蛋白质相互作用预测中的应用,并提出了一个预测蛋白质相互作用的新模型——IT-Ens BPNN,并通过实验验证在酿酒酵母数据集和人类数据集上分别达到了93.64%和97.55%
论文部分内容阅读
近年来,随着计算机技术的发展和生物大分子数据的爆发式增长,将数学理论、计算机算法应用到生物学研究当中的趋势越发明显,对机器学习算法预测蛋白质相互作用的研究也在逐年增多。在此背景下,本文研究了机器学习的一个重要分支——神经网络在蛋白质相互作用预测中的应用,并提出了一个预测蛋白质相互作用的新模型——IT-Ens BPNN,并通过实验验证在酿酒酵母数据集和人类数据集上分别达到了93.64%和97.55%的平均正确率。首先,第一章介绍蛋白质相互作用研究的背景与历史,指出利用机器学习方法研究蛋白质相互作用的意义,以及分析蛋白质相互作用领域的研究现状。接下来在第二章介绍了预测模型中的第一步,即数据预处理,本文首先提出一个新的编码方式——积分变换编码,将原始的蛋白质氨基酸序列转化为等长的数字序列。然后通过数据降维算法将高维数据变为分类器可运行的低维数据,在这里本文详细介绍了基于期望最大化算法的因子分析法,并且给出了两个定理及证明作为对因子分析法的关键流程的说明。本文的第三章则给出了预测模型的第二步,也是蛋白质相互作用预测模型的关键,即集成神经网络分类器的构建。这一章首先介绍人工神经网络的基本知识,将神经网络的构成单元,损失函数,优化算法等写成统一的数学格式,然后介绍基于随机权值平均的集成方式和基于不确定程度的结果集成方式,进而形成我们需要的集成神经网络模型。最后一章与结论着重展示预测模型在数据集上的预测结果,并基于这些结果对本文提出的预测模型的性能进行一个详细的分析。此部分首先介绍本文中用以评价预测模型性能的各种指标与图形曲线,再以图表的形式直观展现此模型中编码器相对于传统编码方法的优秀性能,以及此模型中分类器相对于其它经典分类器的优势。在最后则给出了本文研究的创新之处、不足,以及对未来研究方向的展望等。
其他文献
光学多点气体传感在天然气管道泄漏检测、垃圾填埋场气体排放监测、地下综合管道气体监测等应用中具有重要意义,在这些应用中定量检测和精确定位化学品的延伸距离或区域是必不可少的,但目前大部分光学气体传感器都是单点传感器,在大范围监测中应用成本较高,难以实现大批量应用。而调频连续波(Frequency modulated continuous wave,FMCW)技术是一种频分复用技术,可以实现多个传感器共
本文设计了一种针对太阳能、氢氧燃料电池、振动能为输入能源,超级电容、锂电池为储能器件,并基于决策树算法的多能源复合管理系统。在算法上使用sklearn开源平台建立了两种以CART为基础算法的决策树模型,这两种决策树模型都是为多能源复合管理系统服务的,两种模型中一个是储能优先模式,另一个是效率优先模式。在建立的过程中对输入边界和输出边界进行了边界条件的设置,将能源的输入反馈等信号抽象成了输入部分的特
在生物信息学领域,预测蛋白质功能是帮助理解疾病行为最重要的手段之一。然而,蛋白质功能预测中仍存在诸多挑战。近年来,许多基于卷积神经网络(CNNs)的预测算法被开发出来并取得了不错的结果。现有的方法主要使用了三种蛋白质特征作为预测特征:蛋白质序列,蛋白质互作网络(PPI)和蛋白质结构域。然而,可用的PPI数据较少。因此,本文提出了基于序列相似度和CNNs的蛋白质功能预测算法。此外,我们还将在合并其他
随着深度学习的新算法和新结构在各大框架的落地,网络对物体推算速率和精度得到极大提升。无人机经过多年研究,其续航、稳定性等性能都得到提升。无人机视角广能够搭载相机等设备和设计飞行路线获取地面信息,而无人机节点组网可以进一步扩大节点覆盖范围,高效率的完成各种场景下的任务。然而现有的网络框架往往权值数量特别庞大,导致推理开销大和检测速率慢,当前优秀网络不适合在嵌入式上应用。针对上述问题,本文使用分离卷积
足式跳跃机器人具有落地点发散能够适应复杂地形的优点,在星际探索、灾难救援和军事勘探等方面有着广泛的应用前景,但现有的电机驱动和液压驱动的跳跃机器人缺乏强大的爆发性,需较长的时间蓄力以提供跳跃动力。本文提出了一种全部由压缩气体驱动的具有强大爆发性且能够稳定跳跃的足式双关节跳跃机器人。本文设计一款具有连接脚掌和小腿的踝关节、连接小腿和大腿的膝关节的足式气动双关节跳跃机器人。基于多体动力学的方法求解弹跳
多光谱遥感图像有多个谱段,包含地物丰富的光谱信息,每个谱段的图像对应了地物的光谱响应,在数字地图绘制、遥感图像分类等领域中具有重要应用价值。多光谱图像的空间分辨率较低,而全色图像中包含地物丰富的空间细节信息,因此有必要研究多光谱和全色图像融合算法来挖掘多光谱图像和全色图像中的互补信息。目前多光谱图像融合算法依然存在一些问题:1)没有考虑到多光谱图像上采样对图像融合结果的影响。2)融合图像存在空间细
随着科技进步与社会发展,人类社会对于电能的需求不断提高,全球的能源格局正在向着以电为核心的新型能源结构转换。在这之中作为核心发电设备的汽轮机组则起着非常关键的作用,所以针对汽轮机组中核心部件的检修与维护便有着很高的经济效益与社会意义。由于传统的汽轮机叶片检修手段多需要对汽轮机设备进行开缸验修,检修时间长,停机带来的经济损失大,研制一款可以在汽轮机叶片环境中进行探测活动的软体机器人具有很高的经济效益
线性互补问题在流体问题、经济均衡分析等工程领域中发挥着重要作用。在实际应用中,许多线性互补问题都是随时间不断演变的(即时变线性互补问题)。然而长期以来,关于线性互补问题的大部分研究都集中在与时间无关的情形,鲜少有人研究时变线性互补问题,这无疑减小了它在实际生活中的适用范围。因此,如何更快更准确地求解时变线性互补问题变得迫在眉睫。而与此同时,虽然时变线性互补问题能够更自然、更贴切地描述原始问题的物理
永磁同步电机(Permanent magnet synchronous motor,PMSM)具有功率密度高、结构相对简单、效率高等诸多优点,已被广泛应用于航天国防部门、家用电器、工业传动等领域。永磁同步电机驱动系统中的位置传感器可以采用一定精度的增量式光电编码器,不过传感器价格昂贵。目前,采用基于电机物理数学模型的模型法可实现中高速无位置传感器控制,不过在20%额定转速以下时,系统的稳定性和控制
随着科学技术的发展,各类机器人、操作臂的应用越来越加广泛,而且也逐渐推广到工业生产之外的领域。其中,采用关节内置电机的主驱动方式操作臂,因驱动电机及减速传动机构转动惯量的影响,操作臂很难采用被动式驱动操作,实现由手动牵引至工作位置。尤其在国内,该类被动驱动操作臂的相关研究尚属空白。因此,为满足特定领域的应用需求,本文将设计一种能够由操作人员手动牵引,可以在任意位置锁定,随时释放的被动驱动式操作臂。