基于LASSO-CD方法的生存分析研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:netcapo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生存分析作为一种以缺失数据为研究对象的统计方法,近年来其应用范围由最开始的生物医学领域,扩展到了工业、商业、社会科学等很多领域,在这些领域中都存在对某给定事件发生的时间进行估计和预测的问题。本文在对现有生存分析模型研究的基础上,提出了高维删失数据环境下生存分析模型的研究方法,主要工作及创新点如下:1、拓展了传统Cox比例风险模型的应用范围。传统的Cox比例风险模型应用范围通常被局限在一定的低维数据空间,当其应用于高维数据空间时会影响其适用性和准确性。针对这一问题,本文利用最小绝对值压缩与选择方法(The Least Absolute Shrinkage and Select Operator, LASSO)的变量选择能力和坐标下降算法(Coordinate Descent, CD)的非线性运算能力提出了一种高维删失数据环境下的Cox比例风险模型变量选择方法;2、对LASSO方法、CD算法和Cox比例风险模型均进行了较为深入的研究。在此基础上,对传统的Cox比例风险模型进行优化处理使之适用于LASSO方法。对优化后的模型采用CD算法进行变量选择,最后通过使用AIC和BIC截断准则选择出了最优的模型变量子集;3、采用Matlab实验平台结合蒙特卡洛模拟方法产生适用于生存分析的逐阶Ⅱ类随机高维删失数据,研究了不同样本数目、不同删失比例情况下Cox比例风险模型变量选择方法运行情况,证明了本文理论研究的有效性。之后使用该方法对实际的PBC数据集进行处理,表明了其具有比较好的应用前景。
其他文献
巢湖供电公司在安徽全省范围内率先成立农网施工队伍,尝试以集约发展、专业手段盘活农村电网资金和农电人力资源,激发农电管理机制潜能,夯实农网基础,增强农电机制活力,提升
目的:探讨红细胞分布宽度(Red blood cell distribution width,RDW)与IgA肾病(IgA nephropathy,IgAN)患者临床、病理表现的相关性。方法:回顾性横断面研究。纳入2008年8月-20
基于研究与开发的战略联盟已成为发达国家技术创新的主要趋势,高技术企业由于其自身的特点决定了R&D在发展战略中的重要地位。从高技术企业研发联盟的动因和模式入手,对高技术企
本刊讯 日前,记者从自治区教育厅获悉,中央财政2009年秋季学期中等职业学校国家助学金预算已于近日下达至广西,共计1.7597亿元。目前正在进行资金分配,各有关部门在加快工作进度,以
随着计算机技术尤其是人工智能技术的快速发展,聊天机器人这一新形态的智能对话系统出现并普及,基于此,本文提出“用户出行消费意图识别”任务。所谓出行消费意图,是指在聊天
近日,贵州省宣布在全国率先启动节能发电调度试点工作。
“六一”前夕,泰州供电公司白马供电所全体员工纷纷慷慨解囊,购买了衣服、食品和文化学习用品送到泰州市特殊教育学校的盲童孩子手中,以实际行动为构建和谐企业、助力和谐社会建
每次回家常碰见堂叔,他都会问我工作上的事,我都会很耐心地向他汇报近一段时间电力行业发生的新变化,诸如现在可异地缴纳电费;如果用电出现故障,拨95598免费电话,抢修人员便风雨无
新课程标准的教学目标涉及三个领域,即知识与技能,过程与方法,情感、态度与价值观,亦称三维教学目标。在传统教学过程中,大多数人只注重知识技能目标,忽视过程与方法目标,而把情感、态度、价值观目标看成是可有可无的。这种倾向产生的根源在于,应试教育思想认为情感、态度、价值观目标对实现教育目的不重要,且实践时难把握,效果不明显。这些认识和做法培养出的是高分低能,不懂得感恩,人格不健全的学生,这是违背学生身心
企业要通过建立安全风险管理机制,完善风险管理手段,及时对安全生产偏离正常状态实行风险警告,并对风险进行干预,避免风险加大和事故的发生