面向大数据的模式识别技术在生物及化工典型案例中的应用研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:ztgu8p
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今的大数据时代下,随着数据样本量的增多以及维数的增加,对数据分析以及机器学习算法提出了更高的要求。机器学习算法已经经历了漫长的发展和研究,从最开始的理论研究到现代生活中的实际应用,它一步步地影响着我们的生活生产方式并展示出强大的生命力。本文研究了机器学习在生物信息学以及化工过程这两个背景下的应用。
  肺癌是人类都需共同面对的危险疾病之一,而吸烟是导致肺癌的一项主要原因,因此针对肺癌的吸烟患者与不吸烟患者的模式差异性非常值得研究。文中基于肺腺癌患者的全基因组基因表达、甲基化以及拷贝数变异,以TCGA数据为训练集,EDRN/SPORE数据为测试集,创新性地通过基因表达差异性、已知的重要基因、部分最小二乘相关算法优化分类当前的样本,从而识别出不同的模式并筛选出了关键的特征基因。最终共得出43个基因表达特征基因、48个甲基化特征基因以及75个拷贝数变异特征基因,相应TCGA训练集准确性为79.2%、87.5%和77.1%,EDRN/SPORE测试集准确性为86.3%、76.4%和77.3%。最后通过京都基因与基因组百科全书验证结果,加强了我们所选特征基因的可信度。
  化工过程的故障检测与诊断是化工过程安全生产以及工厂利益的一个重要保障,在传感器及物联网技术的快速发展下,工业数据呈大数据、变量相关性、时变性等特点。对此文中提出了基于变量互信息的递归分布式主成分分析(IRDPCA)。对于工业数据间的变量相关性,文中使用互信息(MI)来考虑它们之间的关系来进行分块。为了解决大数据问题,我们使用基于MapReduce的递归分布主成分分析进行建模,并通过遗忘因子对其进行了优化,克服新数据淹没在老数据中的问题。相应地,递归建模后提出了递归贝叶斯决策融合和递归分层故障诊断的方案。IRDPCA性能是通过氟化工过程和引入了缓慢且不影响产品质量的搅拌器效率变化的田纳西·伊士曼过程进行验证的。得益于合理的分块和对变量的时间跟踪能力,IRDPCA显示出明显的优势。
其他文献
超滤膜分离技术因具有无相变、低能耗、操作方便和占地面积小等诸多优点被广泛应用于水体净化领域,然而超滤膜分离过程因缺乏化学反应过程而造成其应用范围和耐污染能力有限,这是目前超滤膜在实际应用中急需解决的问题之一。本论文制备了一系列负载型钙铁石基铜掺杂钴酸锶(SrCuxCo1?xO3?λ/MCM-41,SCCM)复合催化剂用于活化过一硫酸盐(PMS)降解有机物,采用最优化的催化剂对聚砜(PSf)超滤膜进
学位
酚基釜残是一种工业有机固体废物,目前主要的处理方式以填埋和焚烧为主,易对环境造成污染,同时也会导致大量的资源浪费,对酚基釜残的资源化利用工作势在必行。  本研究以中低温焦油酚基釜残为原料,先采用减压深拔的方式分离轻组分,然后将减压深拔后残留在釜内的固体残渣进行热解,收集并分析各类产物含量及组成。固体残渣进一步通过热转化、氮掺杂制备高性能吸附材料;所得吸附材料分别用于对CO2、甲基橙废水进行吸附性能
学位
重油超临界水改质升级技术已经引起了广泛关注。该技术具有无需催化剂,结焦少且绿色环保等特点。本论文基于密度泛函理论,运用Gaussian09的M06/6-311G(d,p)和M06-2X/6-311+G(2d,p)计算水平,对难脱除杂原子的两种模型化合物苯并噻吩和喹啉在超临界水热条件下的分解脱杂过程进行分子模拟计算和实验考察,研究分解反应机理。  苯并噻吩是以饱和、开环、脱硫的步骤实现脱硫。首先,通
学位
气泡生成机理的研究是微化工的基础内容。在微流体设备中,气泡生成时的界面传递现象占有重要的地位,对研究气泡生成具有重要意义。影响气泡生成的因素包括:操控条件的类型、物性参数以及设备尺寸,但是相关因素对气泡生成的影响机制不太明朗。本文中,氮气作为分散相,不同浓度的甘油水溶液作为连续相,采用高速摄像仪系统性的研究了气泡在T型微通道和依据台阶乳化原理的台阶式微通道中的生成机理。  研究了T型微通道中操控条
学位
针对酒母扩培过程,工业上大多采用的反应器形式为鼓泡塔式和气升式环流反应器,该类型反应器的缺点为气含率较低、循环量小,难以满足扩培工艺的生产需求。喷射环流反应器(Jet Loop Reactor, JLR)作为一种高效的多相流反应器,可以有效提高气含率,增大反应器内液相循环量,对酒母扩培过程有促进作用。目前,文献中针对JLR反应器的研究报道普遍集中在实验室规模,对工业规模的大型反应器开发指导依据不足
芘及其衍生物由于具有出色的光学性能,以及卓越的化学、光、热稳定性而被普遍应用在染料和光电科学领域。另外,由于其具有扁平的多环芳族结构,在溶液中具有很强的π-π堆积趋势,也经常被用作各种超分子组装体的有价值的构建基块。超分子自组装已成为构建复杂化学的功能强大的手段,在超分子自组装的各种组件中,同时包含亲水和疏水部分的两亲性分子成为最强大的构建单元之一。本论文合成了芘修饰的马来酰亚胺染料,进一步通过干
化石燃料的使用给人类社会带来了繁荣,但也使大气中CO2含量在日益增加。近年来,CO2的大量排放已经干扰了地球的自然碳循环,引起了全球变暖、海洋酸化、海平面上升和气候变化等问题。将CO2转化为甲醇是一项符合“甲醇经济”的可持续技术手段,具有可观的前景。  Cu基催化剂是经典的CO2合成甲醇催化剂,其催化性能在长久的使用过程中得到了验证。在目前迅速发展的CO2合成甲醇工业的推动下,对Cu基催化剂进行优
紫脲酸(6-氨基-1,3-二甲基-5-亚硝基尿嘧啶,NAU)是工业生产中合成咖啡因、茶碱的重要中间体,通常以其一水合物的形式通过反应结晶进行制备。但目前关于NAU结晶过程的理论研究十分稀少,并且工业生产中也面临着结晶产品晶习较差、产品含湿率较高等问题,因此本文对NAU的结晶过程进行了详细的研究。  溶剂是影响结晶过程的重要因素,本文首先研究了溶剂对NAU结晶过程的影响。发现水、DMSO、DMF三种
学位
煤炭在我国能源结构中占据主要地位,其燃烧产生的烟气中含有大量的氮氧化物,对人体和环境造成了极大危害,氮氧化物中90%以上为一氧化氮。目前,国内外提出了许多一氧化氮去除方法。但是,这些方法难以满足环保和经济等方面的严格要求。低共熔溶剂因其自身特殊的理化性质,如易合成、无污染等,有望应用于一氧化氮的去除工作中。因此,本文将一氧化氮和低共熔溶剂作为主要研究对象。  本文通过筛选氢键供体与氢键受体,优选苯
学位
反渗透膜分离技术是一种先进的水处理技术,因其节能高效、易于规模化、操作简单等特点,为解决水资源短缺及水污染问题做出巨大贡献。然而,膜污染和膜结垢严重缩短膜的使用寿命,增加能耗和设备维护费用,成为反渗透应用所面临的两大瓶颈。本研究工作主要通过调节膜表面特性来提高反渗透膜的抗污染和抗结垢性能。  首先,论文研究了反渗透系统的操作条件(如料液温度、错流流量、操作压力)对膜表面硅垢形成速率的影响,通过监测
学位