论文部分内容阅读
目的:肝转移是结直肠癌(CRC)患者死亡的主要原因。然而,利用生物信息学寻找用于预测结直肠癌肝转移(CLM)的信使RNA(m RNA)表达谱的研究仍然有限。本研究利用生物信息学分析方法寻找结直肠癌肝转移生物标志物。方法:在公共基因芯片数据库(GEO)下载CRC数据,获得2个数据集共261个样本,其中包含167个非转移样本和94个转移样本,对两批样本混合后随机拆分成训练集195个样本(75%)和验证集66个样本(25%)。对两批数据芯片中提供的原始数据进行Robust Multi-chip Average(RMA)归一化处理,然后利用R-package Combat去除批次效应。筛选在转移组和非转移组t检验P<0.05的基因(426个基因)进行CRC转移相关标志物筛选。将收集到的12对结直肠癌、肝转移组织及正常组织标本,提取组织RNA,通过实时定量PCR技术检测筛选基因和基因表达水平。结果:根据AFFY U133 PLUS2.0的基因注释文件对探针进行过滤,同时去除多个基因的探针。筛选出平均信号值最高的探针信号值作为基因表达值。然后,对筛选出平均信号值≥6且高探针信号值≥7的平均基因进行分析,并在转移组和非转移组中进行t检验,用p值≤0.0 5进行相关标记筛选。利用Lasso回归算法对426个基因进行重要性排序,按重要性排序筛选出了CD163L1、FAM210B、LGR5、LRRC16A、PIK3R3、PLEKHA6、PROSER2、RBBP9、SEMA6D、STOM、THBS1、ZNF544前12个基因作为潜在的CRC转移相关标志物。实时定量PCR结果显示FAM210B和PIK3R3在肝转移组织的表达明显高于CRC组织,同时FAM210B和PIK3R3基因在肝转移组织的表达明显高于正常肠组织(P<0.05)。进一步的统计分析表明,FAM210B和PIK3R3与大肠癌肝转移的转归和预后不良相关。结论:通过基因芯片数据的生物信息学分析筛选与CRC肝转移相关的生物标志物,为进一步研究提供基础,筛选出了CD163L1、FAM210B、LGR5、LRRC16A、PIK3R3、PLEKHA6、PROSER2、RBBP9、SEMA6D、STOM、THBS1、ZNF544等12个基因可作为潜在的CRC转移相关标志物,蛋白质编码基因FAM210B和PIK3R3可作为结直肠癌肝转移的靶基因或治疗靶点。