【摘 要】
:
探究基因调控网络拓扑结构、准确识别基因模块是生物信息学的重要研究内容。基因调控网络的重构与基因模块的识别有助于解析基因间的关系、揭示基因功能,为疾病病理研究与靶向药物研发提供帮助与支持。两者的发展相辅相成相互促进,基因调控网络拓扑结构中存在基因模块,同时基因模块内的网络调控关系又更为活跃与密切。本文利用机器学习相关算法,从基因表达数据出发,深入研究了基因表达数据的模块识别与基因调控网络重构方法,在
论文部分内容阅读
探究基因调控网络拓扑结构、准确识别基因模块是生物信息学的重要研究内容。基因调控网络的重构与基因模块的识别有助于解析基因间的关系、揭示基因功能,为疾病病理研究与靶向药物研发提供帮助与支持。两者的发展相辅相成相互促进,基因调控网络拓扑结构中存在基因模块,同时基因模块内的网络调控关系又更为活跃与密切。本文利用机器学习相关算法,从基因表达数据出发,深入研究了基因表达数据的模块识别与基因调控网络重构方法,在不同类型、不同规模的基因网络上分别进行了实验,以提高算法的可靠性与准确性,主要贡献如下:1)提出了一种基于表达数据的基因模块识别算法ICA-FDR:针对基因表达数据,提出了包括独立成分分析和差异性分析的基因模块识别算法,解决了模块识别算法无法处理模块重叠现象的问题。在不同规模、不同类型的表达数据上均达到较高的识别精度,体现了所提出算法具有优良的稳定性与泛化性。2)提出了一种基于模块识别的基因网络重构算法Modular Boost:首先用ICAFDR算法识别出若干基因模块,结合模块内与模块间调控网络疏密性不同的特点,采用GRNBoost2以及稀疏线性回归分别推理模块内及模块间的调控关系,最后对每个模块内的子网络、模块间的调控边重要性得分分别归一化以获得基因调控网络。Modular Boost解决了目前基因调控网络缺乏拓扑功能性解析、计算时间开销较大的问题,为基因网络重构与基因模块识别提供了一个无缝融合的计算框架。3)提出了一种基于图网络的基因模块识别算法Info Merge:基因调控网络拓扑结构普遍具有社区模块化特征,将其作为基因模块识别的补充信息,将对提升算法的识别精度具有积极作用。Info Merge算法采用Node2Vec图嵌入算法处理调控网络拓扑结构转换为数值型的基因结构特征向量,然后将结构矩阵与原始表达矩阵通过核函数迭代方法进行信息融合,最后对融合信息矩阵进行DBSCAN聚类即可完成基因模块的识别。在相同的基因数据集上,与ICAFDR算法相比,加入网络拓扑信息的Info Merge将模块识别准确度提升了3%~50%,证明了多源信息融合的有效性。
其他文献
膜生物反应器污水处理工艺以膜组件取代传统生物处理技术的二沉池,是一种由活性污泥法与膜分离技术相结合的污水处理技术。随着膜技术的不断成熟,膜生物反应器在城市污水处理中得到广泛应用。然而,在膜生物反应器污水处理过程中,膜污染问题不可避免,会导致运行成本增加、膜生物反应器寿命减少、甚至整个污水处理过程瘫痪,阻碍膜生物反应器平稳运行。为了降低膜污染的发生率,确保污水处理过程的长期稳定运行,对膜污染问题的准
作为行人追踪技术中的关键一环,行人重识别旨在通过不同的摄像头识别同一个人的图像。近年来,随着深度学习技术的发展,行人重识别研究取得了很大的进展,并在刑侦、安防、新零售等方向商业化落地应用。然而,由于模型性能在线评测、无监督模型更新等关键技术的缺失,导致无法构建在线自主运维行人重识别系统,阻碍了该技术的大规模推广应用。针对以上问题,本论文深入研究了网络模型批量归一化(Batch Normalizat
随着机器人技术的发展,人类对其智能性和自主性有了更高的要求。特别是面对未知环境时,例如在灾后救援和地形勘探等场景中,人员直接进入容易出现意外。为避免这种情况,需要机器人在没有先验信息时,对未知的环境进行自主探索并且建立三维模型,方便进行下一步的工作。目前针对该领域的研究集中在轮式机器人上,但是上述场景的地形较复杂,轮式机器人的运动能力有限,无法有效完成探索任务。因此本文使用四足机器人,它有着强大的
镀锌板由于其优良的耐腐蚀性能,广泛应用于汽车制造、包装、桥梁建筑及工业设施等众多领域。焊接作为镀锌板一种连接和成形工艺,在镀锌板的广泛应用中发挥着重要作用。随着基材强度等级的提高,激光焊接以较小的热输入和更窄的热影响区逐渐成为镀锌薄板重要的焊接方式,但是镀锌层的存在给镀锌板激光焊接带来了一定挑战,激光焊接过程中锌层的剧烈蒸发严重破坏了焊接过程的稳定性,焊缝极易出现穿孔和气孔缺陷,尤其当板厚减小时,
由于传统工业机器人过于昂贵和重型,不适用于对中小型企业的部署和非工业场合下的应用。这在一定程度上阻碍了机器人技术的发展和推广。作为工业级机器人的小型、轻量和低成本的典型应用,桌面级机器人在近几年引起了广泛重视。桌面机器人主要应用于部署灵活、反应快速的柔性化工作环境中,本课题以多轴机器人工作站为核心,分别从ROS控制平台搭建、正逆运动学、笛卡尔空间规划和机械臂路径规划算法等方面开展研究工作。理论仿真
癌症是一种严重威胁人类健康和生活的恶性疾病,抗癌药物的研发迫在眉睫。蛋白激酶CK2(Protein kinase CK2)因调控多种细胞生理过程而被认定为重要的抗癌药物靶点。然而,其多数ATP竞争性抑制剂因存在选择性差及成药性低等缺陷而未能成为候选药物,因此,具有高选择性及高成药性的新型CK2抑制剂仍亟待研发。本论文针对丙烯酮骨架,整合定量构效关系及定性分类研究、药物合成及生物学实验等研究策略,开
语音合成(Text to Speech,TTS)是指从文本到音频的生成,具有非常广泛的应用场景。近年来,人机交互需求的增长对合成语音的质量也提出了更高的要求。随着神经网络的发展,语音合成从传统的统计参数估计逐渐转变为基于深度学习的序列建模方法。合成过程通常包括使用声学模型从文本前端得到声学特征,然后使用声码器从声学特征生成波形。在声学模型的研究中,时长建模是一个非常关键的问题,它很大程度上影响了合
近些年,随着物联网、大数据、人工智能和5G通信等技术的快速发展与不断普及,相关领域的电子设备与产品也朝着更高速率、更高带宽及更高密度方向不断提升和发展。目前高速串行链路的单通道速率已经从5Gbps、10Gbps发展提升到25Gbps,甚至56Gbps。随着电路中传输速率及时钟频率的不断提高,高速信号在传输中受到损耗、反射、谐振和串扰等信号完整性问题影响的趋势也日益严重。对于传输速率达到Gbps的高
气液两相流在自然界及工业领域广泛存在,随着设备小型化和微型化的趋势以及小通道优良的传质传热特性,小通道气液两相流成为研究人员关注的重点。段塞流是小通道气液两相流中最普遍存在的流型,且小通道内段塞流参数的测量对于保证工业过程可靠性至关重要。但目前,针对小通道段塞流的参数测量研究尚不充分,相关的测量方法较为匮乏,不能满足工业领域的应用需求。因此,对小通道段塞流参数测量的研究工作具有很大的科研和应用价值
随着科技的飞速发展,自动驾驶技术逐渐成为如今研究的热点。在校园场景中,自主运行的无人驾驶系统对于解决师生“最后三公里”的出行需求有着重要的实际意义。然而,现有的自动驾驶技术严重依赖于详细的高精度先验地图,高昂的地图制作与维护成本不利于校园自动驾驶技术的落地。本文的主要研究内容是校园场景中智能车的自主导航系统设计,目标是在不依赖高精度地图的情况下完成校园内智能车辆的自主导航任务。要实现这个目标,首先