【摘 要】
:
细胞内部是一个复杂且有条不紊的生化环境,正常的生命活动依赖人类蛋白质出现在特定的亚细胞位置才能行使特定的功能。人类蛋白质的亚细胞定位是理解细胞生命过程及蛋白质的
论文部分内容阅读
细胞内部是一个复杂且有条不紊的生化环境,正常的生命活动依赖人类蛋白质出现在特定的亚细胞位置才能行使特定的功能。人类蛋白质的亚细胞定位是理解细胞生命过程及蛋白质的功能重要的生物信息。传统手动注释蛋白质亚细胞位置需要耗费大量的时间和成本。因此,借助高效的机器学习算法建立自动化的蛋白质亚细胞定位分析系统成为一种现实需要。另一方面,成像技术的发展为生物信息学领域累计大量的图像数据,促使人们将生物图像数据转化为相应的生物知识。因此,基于图像的蛋白质亚细胞定位分析也成为必然趋势。基于图像的蛋白质亚细胞定位预测分析主要包括:数据集准备、图像信号分离、特征提取和特征选择、模式分类。围绕这四个步骤,领域内提出了一系列算法,本文主要研究图像信号分离,其主要目的是从图像信号中分离出蛋白质信号。图像信号分离作为数据处理的第一步,在此处产生的误差会在后续数据处理过程中累积并且放大,因此对系统预测精确度有重大影响。所以研究图像信号分离算法,对于提高整个预测系统分类精度具有重大意义。现有图像分离方法主要分为两种:线性分离和盲源分离。由于线性分离不能适应图像的染色变化,所以它对模型的解释性不强,盲源分离方法可以避免这个问题。本文基于盲源分离提出一种加入稀疏和单体体积最小双正则项的非负矩阵分解算法,这种新算法的主要优势是:1.符合图像数据非负特性和混合特点;2.约束图像数据分布的单体体积最小,可以使解更紧支撑;3.稀疏约束使解更具稀疏性。为了验证本文提出算法的有效性,需要建立人类蛋白质亚细胞定位分析系统进行分析。现有的大多数主要集中在单标记学习算法,即将人类蛋白质定位在一个亚细胞器上。在细胞内有部分蛋白质同时出现在两个或者两个以上亚细胞器中,或者在不同亚细胞器之间往返运输动态分布的特殊情况。对于这类定位在多个亚细胞器上的蛋白质,单标记学习算法的亚细胞定位已经不再适用,必须采用能同时定位在不同的亚细胞器上的多标记学习算法。本论文设计基于图像的人类蛋白质亚细胞多标记定位分析系统,能同时处理单标记和多标记学习问题。该系统主要实现步骤包括:1.从人类蛋白质库中整理数据集;2.用本文提出的基于双正则项非负矩阵分解算法应用于图像信号分离,3.用全局的亚细胞位置特征和局部的局部二值模式特征算子提取特征,利用逐步判别分析实现特征降维;4.分类器设计根据是否考虑类标相关性,采用两种多标记算法:二值相关性和分类器链。实验结果显示本文提出的基于双正则项非负矩阵分解算法超过线性分离6%,并且相对于标准非负矩阵分解算法提高10%,说明它更深入挖掘图像数据中隐含的信息、理解图像信号分离模型。在特征提取层面,采用全局特征和局部特征结合的方式优越于仅采用全局特征,说明局部特征可以弥补全局特征缺失的信息。在分类器层面,二值相关性和分类器链有各自优势和缺陷,所以在分类器设计时要兼顾类标相关性进和独立性。
其他文献
自1977年日本科学家白川英树发现导电聚乙炔以来,导电聚合物以其突出的光电性能吸引了众多科学家进行研究。由于这类材料结构的共轭特性,使它能传输电荷、受激发光、从而能够或可能在许多电子或光电子器件上得到应用,如高分子发光二极管、光伏打电池、场效应管等。潜在的应用前景和广泛的应用领域促使科学家竞相研究这类具有光电活性的共轭材料。本文从材料工作者的角度出发,基于目前聚合物光电材料研究中所遇到的的问题,设
目的:近年对静脉血栓栓塞疾病(Venous Thromboembolism VTE)相关研究发现,VTE发生率较以往认为更高,特别是骨科手术及大型胸部肿瘤手术。食管及食管胃结合部癌在我国高发,此
目的:1.了解原发性痛经患者与非原发性痛经女性在月经期间焦虑和抑郁的差异;2.观察隔药灸对寒凝血瘀证原发性痛经患者治疗前后焦虑和抑郁的影响。方法:1.选取2018年6月-2019
研究背景宫颈癌是女性生殖系统中最常见的恶性肿瘤,严重危及女性健康。我国大部分患者诊断时已是局部晚期,盆腔放疗是患者综合治疗过程中重要的手段。越来越多的研究表明,接
近年来,由于铁电及铁磁性的类钙钛矿化合物在信息存储、红外传感以及压电传感等方面的广泛应用而引起科研工作者的研究兴趣。一些类钙钛矿化合物具有优良的铁电性、铁磁性或相变特性,在外部条件的激发下,相变点附近会出现介电异样及热学性质的异样。在设计合成具有铁电或者铁磁性质的相变材料时,由于配合物中的过渡金属往往可以提供良好的铁磁性,含氮的铵盐化合物具有独特的极性结构,往往伴随着氢键及其无序的可能性,为寻找铁
丹皮酚是一种在中国上市的抗炎药物,相比于经典的非甾体抗炎药物,例如塞来昔布,布洛芬,吲哚美辛等,丹皮酚的临床应用并不广泛。目前丹皮酚主要用于皮炎的治疗,如丹皮酚软膏制
立方氮化硼聚晶,是继人造金刚石问世后出现的又一种新型高新技术超硬材料。作为切削硬质材料主要刀具材料,在其加工应用中,高速、超高速、重载等条件使得在切削中产生大量的切削热,较高的切削热产生不仅会使切削工具发生结构变化及热损伤,导致切削工具在加工过程中出现无法预料的磨损,而且也会影响被加工工件表面完整性和尺寸精度。本文旨在通过热处理工艺模拟聚晶立方氮化硼在加工应用中产生的切削热,揭示高温热处理对聚晶立
介孔炭材料具有高热稳定性、高比表面积、大孔容、良好的生物相容性等优点,因此被广泛的应用于吸附、分离以及传感器等领域。为了进一步提升介孔炭材料的性能,许多研究尝试对它们进行功能化修饰,例如:掺杂氮原子和磁性纳米粒子到炭基体上。目前,有机-有机自组装是制备介孔炭材料最常用的方法之一。然而,通过这种方法制备的介孔炭材料的形貌很难控制,并且由于制孔模板与炭前体间的作用力较弱常常导致介孔结构坍塌和变形,这很
地震资料在反演解释过程中,通常需要和测井资料结合应用,以弥补其在纵向分辨率不足的缺点。由于测井资料与地震资料存在尺度、频率与传播路径上的差异,且实际的岩石孔隙结构往往会导致频散现象,这将使得它们在速度反映上存在差异。因此,需要对测井数据进行频散校正,才能使其与地震资料更好的匹配。本文首先对测井数据进行预处理。通过中值滤波剔除异常数据;利用沃尔什变换对测井数据进行初步分层;根据最小速度差及最小厚度原
背景淤胆型肝炎为肝内小胆管胆汁淤积为主要表现的一大类肝炎,其发病机理复杂,病程迁延难愈,并且可存在各种类型的病毒性肝炎当中,特别是长期应用药物的患者,对肝脏损害持续,