【摘 要】
:
目的:基于DNA微阵列技术的基因表达数据挖掘研究为生物医学领域做出了巨大贡献,尤其是在肿瘤的早期诊断和分类研究上有着广泛应用。肿瘤是一种严重威胁人体健康的细胞异常增生类疾病,对肿瘤学进行深入研究可以从其表达谱入手。因此,本文通过挖掘和剖析肿瘤基因表达数据,为探寻肿瘤标志物和科学制定临床诊疗方案提供重要依据。方法:肿瘤基因表达谱通常具有维度高、样本小、噪声大、信息基因少以及类别不平衡等巨大的计算挑战
论文部分内容阅读
目的:基于DNA微阵列技术的基因表达数据挖掘研究为生物医学领域做出了巨大贡献,尤其是在肿瘤的早期诊断和分类研究上有着广泛应用。肿瘤是一种严重威胁人体健康的细胞异常增生类疾病,对肿瘤学进行深入研究可以从其表达谱入手。因此,本文通过挖掘和剖析肿瘤基因表达数据,为探寻肿瘤标志物和科学制定临床诊疗方案提供重要依据。方法:肿瘤基因表达谱通常具有维度高、样本小、噪声大、信息基因少以及类别不平衡等巨大的计算挑战,给肿瘤数据的挖掘和处理工作带来了困难。代价敏感学习方法(cost-sensitive learning,CS)通过引入代价信息处理不平衡数据具有独特的优势,有效解决了传统机器学习算法中一味追求高精度而忽略小类识别的弊端。因此,本文引入代价敏感学习思想并结合相关机器学习理论来处理肿瘤基因数据集。主要研究包括:(1)对于肿瘤基因表达谱中含有数量不小的与疾病无关的冗余基因,提出相关性的快速过滤(fast correlation-based filter,FCBF)结合CS的两阶段过滤式特征选择算法来确定信息基因。该方法第一步采用FCBF快速过滤大量无关和冗余基因,然后引入误分类代价矩阵,利用代价敏感思想进一步约减冗余基因;(2)研究了集成学习利用组合分类器在处理分类问题上的优势,提出采用嵌入代价敏感的朴素贝叶斯优化Stacking集成分类器来分类预测肿瘤样本数据。结果:将提出的算法在多组肿瘤数据集上进行验证,并对比其他多组混合算法,实验结果表明FCBF结合CS的基因选择方法能够选择数目较少且分类性能更优的信息基因子集。另外,对于嵌入了代价敏感的朴素贝叶斯优化Stacking集成的分类模型,应用于多组肿瘤数据样本中,通过与其他多种分类方法比较,该优化集成分类方法的鲁棒性更好且分类性能更佳。结论:本文所提出的信息基因选择方法能够筛选出与分类预测紧密相关的信息基因子集,并且构建的分类模型应用于多种类型的肿瘤数据上均可获得更优的分类结果,验证了代价敏感学习方法在处理高维且不平衡的肿瘤数据上的优势,对探索肿瘤致病机理和临床应用研究具有一定价值。
其他文献
水稻是我国重要粮食作物,其产量对粮食安全的保障具有重要作用。稻田中氮素流失严重,控释氮肥因其肥料释放的可控性是管理水稻氮肥的重要途径。但其在水稻上的应用效果受到水稻类型、土壤性质、施肥方式等因素的影响,导致控释氮肥的应用效果参差不齐。因此,本研究收集我国近30年包膜控释肥料的稻田试验数据,以Meta分析技术开展控释氮肥在水稻上的应用效果分析,主要因子包括土壤性质(p H、质地、全氮、有机质)、气候
项目化长作业区别于传统的作业模式,它解决了作业内容单调、作业形式机械化的弊端。初中地理项目化长作业的设计与实施,能够满足“双减”政策的要求,并帮助培养学生核心素养。但目前义务教育阶段项目化长作业的实践成果及其应用效率仍然有待考察,因此本研究将从其基本特点入手,立足实际,通过对应学生的教学需求,进一步研究项目化长作业的设计重点及实践策略。希望能够通过创新与解读,为初中地理作业任务减负,并开辟出一条新
近年来,在全球气候变暖的影响下区域季节性冻土和多年冻土发生了显著改变。季节性冻土的冻融循环过程以及多年冻土的分布对寒区水文过程、植被生长、土壤微生物活性、农林业生产以及城市基础设施稳定性等方面都有着重要的影响。本文以我国重要的粮食生产基地-黑龙江省为研究区,基于站点实测数据、遥感数据以及全球气候模式等,采用数理统计和数值模拟方法开展了以下几部分研究:首先,从黑龙江省31个站点的逐日土壤冻结、表层土
目前针对Pickering乳液的研究大多是以无机固体颗粒作为稳定剂,在食品工业应用有限。为了使Pickering乳液能够应用在食品工业,且具有更高的营养价值,本课题采用超微茶粉作为稳定剂来制备Pickering乳液。为了使超微茶粉Pickering乳液更加稳定,本课题通过试验,从果胶、海藻酸钠、瓜尔豆胶、羧甲基纤维素钠中选择了能使超微茶粉Pickering乳液更稳定的果胶作为其助乳剂。对超微茶粉P
目的:探讨在术中超声监测下腹腔镜肾部分切除术治疗完全内生性肾肿瘤的安全性和有效性。方法:回顾性分析2018年1月至2021年7月于我院行术中超声监测下腹腔镜肾部分切除术的23例完全内生型肾肿瘤(R.E.N.A.L评分系统中的“E”域为3分)患者的临床资料,所有病例结合术前影像学检查均确诊为完全内生性肾肿瘤。其中男性17例,女性6例。年龄36~75岁,平均56.0±10.3岁,肿瘤位于右侧8例,左侧
数学“长作业”是一种具有探究性、反思性、交流性、拓展性等特征的课程资源,立足教学实践有效开发“长作业”这一课程资源,将有助于提高学生的学习兴趣和探究能力,拓展学生的数学学习方式.
目的:探讨糖尿病(Diabetes mellitus,DM)患者合并皮肤病变的患病率和临床特点,分析危险因素,以此提高内分泌科及皮肤科医生对于DM常见皮肤病变的诊疗意识。为内分泌科及皮肤科医生制定DM合并皮肤病变筛查的诊疗路径,设计筛查图表和病历记录模板嵌入电子病历系统中,供门诊及临床医生参考。方法:选取2020年12月-2021年4月期间,于芜湖市第二人民医院内分泌科住院所有确诊为DM的患者77
目的:研究观察利格列汀联合胰岛素用于早期2型糖尿病肾病(diabetic nephropathy,DKD)患者治疗的临床效果,为这类人群提供有实用价值的治疗方法。方法:分析2019年10月~2021年10月在皖南医学院第一附属医院内分泌科就诊的100例早期2型糖尿病肾病患者,以随机分组法将DKD患者随机分为LT组(n=50)和对照组(n=50)。对照组采取预混胰岛素或胰岛素强化治疗方案,LT组在对