高维数据下多元逻辑回归分析中的模型选择

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:peiyhpyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据分析已成为在许许多多科学领域广受关注的热点,包括基因组学、经济学以及健康科学等等。例如,随着基因组学的进步,通过微阵列技术,可以同时获得成千上万个基因表达数据,然而可供研究的样本个数由于时间和资金的限制,一般只有几百个,这种数据结构被称为小-n-大-p的结构。多元逻辑回归,又叫做多类别逻辑回归,是一种多类别分类学习方法,能够同时预测所观测到的数据点属于多个类别的概率。一个常见的理论假设是稀疏性假设,也即是说,在搜集到的大量特征中,只有一小部分真正对预测起作用,这个假设在现实生活中也能找到经验支持。有了稀疏性假设,正则化方法不仅可以提高统计精确度,还可以增加模型的可解释性,以及减小计算复杂度。Group lasso是lasso的一种推广形式。稀疏group lasso(SGL)将lasso和group lasso结合起来,因此能得到组内组间都稀疏的解。但是,多元逻辑回归中的lasso类算法需要提供理论上找到最优特征子集的支持。因此,本文提出,结合EBIC准则对多元逻辑回归模型进行模型选择。并且还证明了模型选择的一致性。最后,通过数值模拟来评估所提出方法的效果。并且还在亚马逊评论作者分类数据集上进行实例分析,以展示模型的表现。
其他文献
山西是全国最大、最重要的煤炭生产基地,也是全国最大的焦炭生产基地.山西焦炭产业在保障国家能源安全,保障国民经济持续快速发展中发挥着重要作用.但是目前,山西焦炭产业的
目的评估三维对比增强核磁共振血管造影(Three dimensional contrast enhanced magnetic resonance an-giography 3DCEMRA)诊断颈动脉狭窄的应用价值。方法 36例拟诊颈动脉狭窄
住房公积金制度是国务院深化城镇住房制度改革的一项重大房改政策,是一种政策性、义务性和长期性的住房储蓄.由于住房公积金直接关系到企业及职工的切身利益,因此,作为承担有
病例女性,34岁,因咳嗽、气紧1^+个月,痰中带血2天,在当地卫生院经抗炎、对症治疗无效,即到旺苍县医院摄片检查后,提示右上肺改变,考虑结核的可能性大。于2010年1月21日来我中心进一步
在位相差异技术原理的基础上,利用现有平台,通过室内实验以及室外推扫成像试验,检验了位相差异技术波前反演的效果.试验表明:以干涉仪实测波前与反演波前的残差均方根误差作为
抗生素在养殖业的滥用,导致耐药菌株增加、畜禽肠道菌群紊乱、动物免疫力下降等。益生菌作为抗生素的有效替代品,具有无污染、无耐药性和无药物残留的优点,已广泛应用于畜牧
目的观察扬刺结合走罐治疗肩背肌筋膜炎的临床疗效。方法对108例肩背肌筋膜炎患者,男性42例、女性66例,针刺肩背疼痛的肌肉或已形成硬结的肌束,结合走罐治疗。结果 108例患者
目的探讨巴曲酶治疗急性进展性缺血性卒中临床疗效及副作用,以及治疗前和治疗5天后凝血四项变化。方法将发病72小时内急性进展性缺血性卒中42例随机分为两组:巴曲酶组加常规治
目的探讨高频超声在小儿急性肠套叠的诊断和治疗中的临床应用价值。方法对48例临床疑诊急性肠套叠的小儿患者行高频超声检查,确诊患者在超声引导下采用0.9%NaCl溶液灌肠复位
当前,基于传统方法的逆变器故障诊断技术存在提取特征不足和冗余信息多的问题,导致诊断准确率不高,并且大数据信息时代带给信号处理技术的难题日益增多,尤其针对逆变器复杂故障,建立在传统奈奎斯特采样定理的信号采样方法逐渐不再适用。因此将CS(Compressed Sensing,压缩感知)采样方法结合CNN(Convolution Neural Network,卷积神经网络)诊断方法应用于大数据复杂逆变器