基于大数据的前列腺癌生物信息学分析

来源 :中山大学学报(医学版) | 被引量 : 0次 | 上传用户:showwing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】利用生物信息学的方法,对GEO和TCGA两个基因组学数据库进行分析,探究与前列腺癌相关的差异基因及相关的调控网络。【方法】综合GEO数据库的前列腺癌基因表达芯片数据(GSE46602、GSE55945)和TCGA数据库的RNA-seq数据,利用GEO2R及R语言的edgeR包进行基因差异分析,获得共同的显著差异基因,结合R语言的clusterProfiler包进行GO功能分析及KEGG通路分析,同时利用string网站进行蛋白互作网络分析,筛选出前列腺癌中调节蛋白表达量的关键基因,再结合TCGA临
其他文献
基因表达数据具有高维、小样本、多噪声和高冗余的特点,使传统聚类方法效率较低.子空间分割是高维数据聚类的有效手段,但直接对基因表达数据进行子空间分割会降低聚类性能.为了更
针对不完备弱标记数据的学习问题,提出基于粗糙集理论的半监督协同学习模型.首先定义不完备弱标记数据的半监督差别矩阵,提出充分、具有差异性的约简子空间获取算法.然后在有标记
土壤是农业生产的基地,也是农业生产的基本资料。土壤管理是土壤的施肥耕作管理,把未曾利用的动植物残体,通过耕作,归还土壤,变为植物可利用的养分,同时增加和更新土壤有机物。这正
螺杆压缩机是我国石油化工企业的主要气体压缩设备之一,其运行状态直接影响整个压缩机组的安全性、可靠性及生产效率。螺杆压缩机一旦发生故障,将极有可能引起整套设备甚至整