人工智能算法识别原发性黑色素瘤和转移性黑色素瘤的研究

来源 :广西医科大学 | 被引量 : 0次 | 上传用户:ly_exe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:转移性黑色素瘤患者预后差,本研究引用人工智能算法,通过建立预测模型对转移性黑色素瘤和原发性黑色素瘤进行分类识别,构建了黑色素瘤分类识别的新模型,这将有利于改善黑色素瘤患者的预后,并为临床治疗方案的选择提供便利条件。方法:1.收集并整理TCPA蛋白质组学数据库的354例黑色素瘤患者的反相蛋白阵列表达谱数据,剔除有缺失值的蛋白质特征。采用T-SNE和PCA方法对蛋白质特征进行降维和可视化,利用Embeded嵌入法进行特征筛选,筛选出对模型最优意义的蛋白质特征生物标记物。将筛选好的特征子集导入python编程软件,利用Scikit-learn包进行人工智能算法分类模型构建。2.采用6种人工智能算法,将每位黑色素瘤患者作为一个样本量,其相应的蛋白质特征作为该样本量的属性值,在python软件中使用train_test_split分割法并设定随机数种子将354例的前80%作为训练集输入6种人工智能算法程序中进行黑箱操作,算法通过对数据进行学习并生成了机器学习模型,将后20%的样本作为测试集,以验证该模型的准确度和泛化能力,最终构建了基于人工智能算法的转移性黑色素瘤和原发性黑色素瘤分类识别模型。3.基于相同数据集对6种人工智能算法可调整的超参数进行优化和调整,寻找在不同人工智能算法下该数据集所构成预测模型的最优解。并利用SMOTE样本不平衡处理法或算法自带的调整样本不平衡参数对数据样本标签不平衡进行了处理,对经过样本不平衡处理后的数据重新构建模型,并优化模型参数,寻找经过样本不平衡处理后不同算法的最优解。结果:1.T-SNE及PCA分析结果显示,354例黑色素瘤反相蛋白阵列表达谱的数据不完全呈线性分布,基于线性拟合的模型不能达到较高的准确率。2.基于Embeded嵌入法从213个蛋白质特征种筛选出了16个对模型最有意义的蛋白质特征生物标记物,分别是X4EBP1_p T37T46,CKIT,CAVEOLIN1,ECADHERIN,EIF4E,FIBRONECTIN,PR,YAP,EIF4G,NRAS,NDRG1_p T346,RAB25,EPPK1,ANNEXIN1,MSH6,BRAF_p S445。3.Logistic回归算法中,数据在样本不平衡处理前在测试集上的准确率最高值达到85.92%,敏感度为100%,特异度为50%,AUC值=0.947,经过SMOTE样本不平衡处理后,准确率最高值为88.73%,敏感度为94.11%,特异度为75%,AUC值=0.944。决策树算法中,数据在样本不平衡处理前在测试集上的准确率最高值达到84.50%,敏感度为98.04%,特异度为50%,AUC值=0.870,经过SMOTE样本不平衡处理后,准确率最高值为84.50%,敏感度为94.12%,特异度为60%,AUC值=0.767。随机森林算法中,数据在样本不平衡处理前在测试集上的准确率最高值达到85.92%,敏感度为100%,特异度为50%,AUC值=0.923,经过SMOTE样本不平衡处理后,准确率最高值为83.10%,敏感度为100%,特异度为40%,AUC值=0.862。在线性核函数支持向量机中,数据在样本不平衡处理前在测试集上的准确率最高值达到80.28%,敏感度为100%,特异度为30%,AUC值=0.943,经过SMOTE样本不平衡处理后,准确率最高值为91.55%,敏感度为100%,特异度为70%,AUC值=0.943。在多项式核函数支持向量机中,数据在样本不平衡处理前在测试集上的准确率最高值达到90.14%,敏感度为100%,特异度为65%,AUC值=0.878,经过SMOTE样本不平衡处理后,准确率最高值为91.55%,敏感度为96.07%,特异度为80%,AUC值=0.918。双曲正切核函数支持向量机中,数据在样本不平衡处理前在测试集上的准确率最高值达到84.51%,敏感度为100%,特异度为45%,AUC值=0.903,经过SMOTE样本不平衡处理后,准确率最高值为88.73%,敏感度为96.07%,特异度为70%,AUC值=0.933。高斯径向基核函数支持向量机中,数据在样本不平衡处理前在测试集上的准确率最高值达到88.73%,敏感度为100%,特异度为60%,AUC值=0.860,经过SMOTE样本不平衡处理后,准确率最高值为92.96%,敏感度为100.00%,特异度为75%,AUC值=0.907。朴素贝叶斯算法中,数据在样本不平衡处理前在测试集上的准确率为85.92%,敏感度为98.04%,特异度为55%,AUC值=0.922,经过SMOTE样本不平衡处理后,准确率最高值为87.32%,敏感度为96.08%,特异度为65%,AUC值=0.921。极限梯度提升算法中,数据在样本不平衡处理前在测试集上的准确率最高值达到84.51%,敏感度为100%,特异度为45%,AUC值=0.933,经过SMOTE样本不平衡处理后,准确率最高值为88.70%,敏感度为98.04%,特异度为60%,AUC值=0.910。结论:将人工智能算法应用于黑色素瘤的分类识别中,能较好的区分转移性黑色素瘤和原发性黑色素瘤。
其他文献
目的:本文探讨七种肿瘤相关自身抗体(p53、PGP9.5、SOX2、GAGE7、GBU4-5、MAGE A1、CAGE)对肺癌的诊断价值,并对比具有不同临床特点(症状、年龄、性别、吸烟史、CT影像病灶大小和诊断、病理类型、肿瘤分期、淋巴结转移、肿瘤抗原标志物等)的患者肿瘤相关自身抗体的水平值、阳性率差异,为临床诊断肺癌提供参考依据。方法:选择2019年12月1日至2019年12月31日期间因咳嗽、
目的呼吸性细支气管炎伴间质性肺病(respiratory bronchiolitisasociated interstitial lung disease,RBILD)是一种与吸烟密切相关的间质性肺疾病,以呼吸性细支气管为中心的含色素的肺泡巨噬细胞片状聚集是其主要病理特征。起病隐匿,疾病加重可表现为渐进性劳力性气促和咳嗽,可以合并肺部感染和低氧血症,多数病例报道提示预后良好,合并肺癌的患者更是极为
目的:通过经脐单孔腹腔镜手术在妊娠合并巨大卵巢囊肿的治疗与传统三孔腹腔镜手术的比较,探索并研究经脐单孔腹腔镜手术的安全性和有效性,为今后这类患者在选择治疗方式时提供更多的参考。方法:本研究采用单中心前瞻性随机化研究方法,按照简单随机化原则,将符合条件入组的患者随机分为经脐单孔腹腔镜手术组(A)和传统三孔腹腔镜手术组(B)。研究对象选取自2017年8月至2019年12月广西壮族自治区人民医院收治的经
研究目的:c-kit+心脏祖细胞(cardiac progenitor cells,CPCs)在缺血性心肌病的治疗中具有重要作用,但该细胞的属性仍未完全清楚。本实验将主要探究:1.从蛋白层面证明c-kit+CPCs可以表达和分泌内皮细胞特征相关的蛋白;2.c-kit+CPCs缺氧处理后,检测c-kit+CPCs表达和分泌细胞因子的变化。研究方法:1.取成年雄性C57BL/6小鼠心脏切成约1mm~3
研究目的:癌症是世界范围内的一个重大公共问题,结肠癌是消化系统中最常见的致命癌症。目前,结肠癌晚期患者的治疗以化疗为主,然而由于肿瘤细胞耐药性提高和化疗的毒副作用,使治疗效果不佳,患者的生存率低,急需寻找新途径。磁场由于副作用小,应用面广,有望成为肿瘤治疗的新手段。目前已有临床研究显示,磁疗在癌症治疗中发挥积极作用。铁死亡是近几年提出的一种细胞死亡方式,其依赖于铁离子的存在与活性氧的积累,这与磁场
目的 通过建立矽肺兔模型,并对其进行经胸肺超声扫查,探讨矽肺兔模型超声声像特征,与胸部X线分期进行比较,探讨经胸肺超声在矽肺兔模型中的应用价值。方法 将24只健康的新西兰兔分实验组(19只)和对照组(5只),造模前胸部备皮,按照分区分别留取所有兔的肺部超声声像图,并测量胸膜线厚度。实验组经气管注入二氧化硅粉尘悬浊液建立矽肺兔模型,对照组采用同样的方法注入等量的生理盐水。造模2月后,行经胸肺部超声检
目的:了解一般人群血清细胞间黏附分子-1(Intercellular adhesion molecule-1,ICAM-1)、血管细胞粘附分子-1(Vascular cell adhesion molecule-1,VCAM-1)水平升高的影响因素,探讨与血清ICAM-1、VCAM-1水平升高相关的代谢改变,为进一步从代谢角度探讨血管内皮炎症早期病理改变的机制提供线索。方法:本研究属于现况研究设计
目的评估全麻机械通气下以不同水平PPV指导的液体治疗对下肢止血带相关低血压发生率的影响及松止血带后血乳酸对血压变化的影响。方法选择择期全麻复合股神经阻滞下行单侧膝关节镜手术患者80例,麻醉前随机分组(A组PPV≤7%,B组7%0.05);2、止血带放气后5分钟内所有患者的血压都有不同程度的下降,A、B两组松止血带相关低血压发生率有统计学意义(35.9%vs75.7%.P0.05);3、松止血带前后
目的:探索蛋白磷酸酶2A催化亚基(PP2Ac)蛋白在人肝细胞癌(HCC)和癌旁组织中的表达水平;探讨人肝癌细胞hep G2和Huh-7经过氧化氢(H2O2)氧化受损和黄曲霉毒素B1(AFB1)中毒后细胞中PP2Ac-α+β和去甲基PP2Ac蛋白表达水平以及对肝癌细胞的影响。方法:1.收集2017年7月-2019年7月期间广西医科大学附属肿瘤医院肝胆胰脾外科进行肝脏肿瘤切除并且由病理确定诊断是HCC
背景:口腔鳞状细胞癌(OSCC)是口腔最常见的恶性肿瘤,其淋巴结转移率高。目前组织活检是OSCC确诊的金标准,大多数OSCC在被发现并确诊时都已达到疾病的中、晚期或已发生转移。转移是OSCC患者死亡的主要原因。当患者发生淋巴结转移时,五年存活率从80%急剧下降到40%以下。近年来研究发现外泌体可能在解释肿瘤的转移和复发中发挥重要作用,而microRNA(miRNA)是外泌体的内含物之一,越来越多的