基于miRNA与环境因子的乳腺癌发病预测研究及miREN数据库的构建

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:shanlin_shanlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近的研究表明,基因和环境是引起疾病特别是恶性肿瘤的最主要的因素。在基因中,miRNA是目前最新最热点的研究对象;环境因素有alcohol,tobacco,hypoxia等。疾病相关的miRNA信息大多存在于文献中,为了便于研究miRNA与疾病的关系,本文建立了包含疾病相关miRNA,环境因子以及疾病的数据库miREN。  本文所作的工作主要是以下几点:  第一,收集并阅读有关文献资料,手动整理文献中miRNA,环境因子以及疾病信息。针对大多数数据存在于文字描述中以及文献中提供的数据冗余度较大且数据的格式也不统一的问题,对所整理的信息进行词汇校对,术语统一以及归一化等预处理工作。  第二,构建miREN(miRNA and Environment Database)在线数据库查询及更新程序。对miREN数据库进行了需求调研分析,概要设计以及详细设计。在以上工作的基础上进行编码和测试。测试结果表明miREN数据库系统对数据的查询是完整的准确的高效的。该数据库的构建,可以为相关研究领域的研究者提供一个全面、方便的miRNA,环境以及疾病信息资源。  第三,从miREN数据库中选取乳腺癌作为主要研究对象,对乳腺癌进行是否病发的预测。考虑到支持向量机具有小样本,稀疏性以及非线性拟合能力强等方面的优势,本文将SVM引入到乳腺癌的发病预测之中,并利用遗传算法对SVM的参数进行优化,通过仿真实验发现改进后的SVM模型在乳腺癌发病预测准确率上提高了4.6154%。  第四,验证SVM在恶性肿瘤发病预测中的通用性。从miREN数据库中选取了其他几种恶性肿瘤(结肠癌,肺癌),SVM模型以及参数优化后的SVM模型对以上恶性肿瘤的预测同样取得了较好的预测结果。在数据有预处理的前提下,SVM在恶性肿瘤的发病预测的应用上具有通用性。
其他文献
对于火电厂,锅炉的过热汽温是很重要的一个参数,因为它是推动汽轮机做功的第一步。过热汽温高于要求值时,对其他元件有损害,长期超温会发生危险;汽温低于要求值时,汽轮机达不
随着社会经济的发展、环境污染的加剧以及传统能源的日益短缺,人们对可再生能源的需求不断增长,分布式发电技术由此获得了长足发展。但分布式发电存在入网困难、不可控等缺点,在这一背景下,微电网应运而生,成为解决可再生能源利用问题的重要途径。在多逆变器并联构成的孤岛微电网系统中,多采取传统下垂控制策略来分担系统公共负荷,受系统中线路阻抗特性与本地负荷波动性的影响,这一方法存在功率分配不均的问题,甚至引起系统
压力容器是工业生产过程中的一种重要设备,广泛地用于化工、炼油、机械、动力、纺织、冶金、核能及运输等部门。压力容器一旦由于裂纹而引发泄露或爆炸,将产生灾难性事故。目前
计算机立体视觉是计算机视觉研究的一个重要分支科学,主要研究如何借助成像技术从图像里获取场景中物体的深度信息。图像深度即图片上某点对应的真实物体在空间上到该图片物
作为可再生清洁能源,风力发电重要性与日俱增。由于自然风具有较强的随机性,风力发电输出功率具有很大的波动性和不确定性,也提高了风机控制难度;风电场所处自然环境较为恶劣
电子商务的飞速发展,促进了物流的快速发展,物流服务水平的高低已经成为影响电商企业成败的重要因素,目前电商企业的物流模式主要有选择自建或第三方物流模式,以及正在发展的
伴随着网络的普及以及控制技术和网络技术的不断发展,网络控制系统应运而生。由于网络的引入产生了新的控制问题,本文则主要针对具有随机时延的网络控制系统的控制问题进行了