基于随机森林的宫颈鳞癌放化疗疗效预测

来源 :软件学报 | 被引量 : 0次 | 上传用户:zhongqiwen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对ⅡB~IVA期的宫颈鳞癌患者来说,放化疗治疗后肿瘤区域可能会出现完全缓解和不完全缓解的情况.根据临床经验可知,如果放化疗后肿瘤区域不能完全缓解,那么患者的生存率很低,而且再采取手术治疗或口服靶向药治疗等其他疗法很难有效.因此,在治疗前筛选出对放化疗不敏感的患者,转而探索个性化治疗方案很有必要.针对上述问题,将放化疗疗效预测问题视为图像分类问题,提出一种基于随机森林算法的宫颈鳞癌放化疗疗效预测模型,筛选出对放化疗不敏感的患者.该模型首先利用小波变换和高斯拉普拉斯算子对3D宫颈鳞癌MRI(magnetic resonance imaging)进行预处理;其次,利用U-net分割宫颈鳞癌MR图像中肿瘤区域;再次,结合3D宫颈鳞癌MR图像和相应的肿瘤区域分割结果提取宫颈鳞癌病变区域的纹理及形状特征,并对提取的特征进行筛选,训练随机森林模型.实验数据集由已标记的85位宫颈鳞癌IIB~IVA期患者治疗前MR图像序列组成.实验结果表明,基于随机森林算法的疗效预测模型预测宫颈鳞癌放化疗疗效AUC值为0.921,优于目前最先进的预测方法.
其他文献
案件舆情摘要是从涉及特定案件的新闻文本簇中,抽取能够概括其主题信息的几个句子作为摘要.案件舆情摘要可以看作特定领域的多文档摘要,与一般的摘要任务相比,可以通过一些贯穿于整个文本簇的案件要素来表征其主题信息.在文本簇中,由于句子与句子之间存在关联关系,案件要素与句子亦存在着不同程度的关联关系,这些关联关系对摘要句的抽取有着重要的作用.提出了基于案件要素句子关联图卷积的案件文本摘要方法,采用图的结构来对多文本簇进行建模,句子作为主节点,词和案件要素作为辅助节点来增强句子之间的关联关系,利用多种特征计算不同节点
代理辅助进化算法(SAEA)是目前解决昂贵优化问题的一种有效途径.提出一种基于多样性的代理辅助进化算法(DSAEA)来解决昂贵多目标优化问题.DSAEA采用Kriging模型近似每个目标来代替原目标函数进行评估,加速了进化算法的优化过程.其引入参考向量把问题分解为多个子问题,根据解与参考向量之间的角度大小建立它们的相关性,然后计算出最小相关解集.在此基础上,候选解生成算子和选择算子会趋向于保留多样性的解.另外,训练集A在每次迭代后会进行更新,根据多样性删除价值不大的样本以减少建模时间.实验部分对DSAEA
随着滴滴、Uber等出租车服务的日益普及,用户的乘车需求预测逐渐成为智慧城市、智慧交通的重要组成部分.准确的预测模型既可以满足用户的出行需求,也可以降低道路车辆空载率,有效地避免资源浪费,并缓解交通压力.车辆服务商可以收集到大量GPS数据及用户需求数据,然而,如何合理运用数据进行需求预测,是关键且实用的问题.提出一种结合城市POI的可变形卷积时空网络(DCSN)模型来预测区域乘车需求,模型包括两部分——可变形卷积时空模型与POI需求关联模型:前者即通过DCN与LSTM建模未来需求与时空之间的相关性,后者则
数据隐私保护问题已成为推荐系统面临的主要挑战之一.随着《中华人民共和国网络安全法》的颁布和欧盟《通用数据保护条例》的实施,数据隐私和安全成为了世界性的趋势.联邦学习可通过不交换数据训练全局模型,不会泄露用户隐私.但是联邦学习存在每台设备数据量少、模型容易过拟合、数据稀疏导致训练好的模型很难达到较高的预测精度等问题.同时,随着5G(the 5th generation mobile communication technology)时代的到来,个人设备数据量和传输速率预计比当前提高10~100倍,因此要求模
提出一种脑电图(electroencephalograph,简称EEG)数据表示方法,将一维链式EEG向量序列转换成二维网状矩阵序列,使矩阵结构与EEG电极位置的脑区分布相对应,以此来更好地表示物理上多个相邻电极EEG信号之间的空间相关性.再应用滑动窗将二维矩阵序列分成一个个等长的时间片段,作为新的融合了EEG时空相关性的数据表示.还提出了级联卷积-循环神经网络(CASC_CNN_LSTM)与级联卷积-卷积神经网络(CASC_CNN_CNN)这两种混合深度学习模型,二者都通过CNN卷积神经网络从转换的二维
数据采样是快速提取大规模数据集中有用信息的重要手段,为更好地应对越来越大规模的数据高效处理要求,借助近邻传播算法的优异性能,通过引入分层增量处理和样本点动态赋权策略,实现了一种能够非常有效地平衡处理效率和采样质量的新方法.其中的分层增量处理策略考虑将原始的大规模数据集进行分批处理后再综合;而样本点动态赋权则考虑在近邻传播过程中对样本点进行合理的动态赋权,以获得采样的数据空间上更好的全局一致性.实验中,分别使用人工数据集、UCI标准数据集和图像数据集进行性能分析,结果表明:新方法与现有相关方法在采样划分质量
协同过滤推荐算法中的矩阵分解因其简单、易于实现,得到了广泛的应用.但是矩阵分解通过简单的线性内积建模用户和物品之间的非线性交互关系,限制了模型的表达能力.为此,He等人提出了广义矩阵分解模型,通过非线性激活函数和连接权重,将矩阵分解推广到广义矩阵分解,为模型赋予建模用户和物品间的二阶非线性交互关系的能力.但是广义矩阵分解模型是一个浅层模型,并不能很好地建模用户和物品间高阶交互关系,一定程度上可能会影响模型性能.受广义矩阵分解模型启发,提出了深度矩阵分解模型(deep matrix factorizatio
为解决可验证外包数据库方案存在的预处理阶段开销较大及不支持公共可验证的问题,提出了一个全委托的公共可验证的外包数据库模型.给出了模型的架构及交互流程,对模型进行了形式化定义,并给出了模型的正确性定义和安全性定义.利用双线性映射及可验证外包模幂运算协议,构建了一个全委托的公共可验证外包数据库方案,且给出了各个算法的详细描述,证明了方案的正确性和安全性.其安全性可规约为BDHE(bilinear diffie-hellman exponent)难题.与现有方案及不进行全委托计算的方案相比,全委托的公共可验证的
已有的隐私保护频繁模式挖掘随机化方法不考虑隐私保护需求差异性,对所有个体运用统一的随机化参数,实施同等的保护,无法满足个体对隐私的偏好.提出基于分组随机化的隐私保护频繁模式挖掘方法(grouping-based randomization for privacy preserving frequent pattern mining,简称GR-PPFM).该方法根据不同个体的隐私保护要求进行分组,为每一组数据设置不同的隐私保护级别和与之相适应的随机化参数.在合成数据和真实数据中的实验结果表明:相对于统一单参
随着大数据、机器学习等技术的发展,网络流量与任务的计算量也随之快速增长.研究人员提出了内容分发网络(CDN)、边缘计算等平台技术,但CDN只能解决数据存储,而边缘计算存在着难以管理和不能跨集群进行资源调度等问题.容器化技术广泛应用在边缘计算场景中,但目前,边缘计算采取的容器编排策略普遍比较低效,导致任务的计算延迟仍然过长.提出了功能分发网络FDN(function delivery network),一方面为用户提供了访问边缘计算资源的统一接口和容器化的计算平台,无需进行繁琐的计算资源配置;另一方面,FD