【摘 要】
:
目的探讨高维生物学数据的多阶段组合降维策略。方法以微阵列数据的判别分析为例,采用实际数据和模拟数据相结合的方法,提出"初步选维→进一步降维"的两阶段组合降维策略,并
【机 构】
:
南京医科大学公共卫生学院流行病与卫生统计学系,南京医科大学现代毒理学教育部重点实验室,昆山市卫生监督所
论文部分内容阅读
目的探讨高维生物学数据的多阶段组合降维策略。方法以微阵列数据的判别分析为例,采用实际数据和模拟数据相结合的方法,提出"初步选维→进一步降维"的两阶段组合降维策略,并与后续的"判别→验证"相结合,形成了"选维→降维→判别→验证"的判别分析思路。以后续判别分析的预测效果、预测结果的稳定性与敏感性等为指标,对2种单一降维(PCA,PLS)方法和4种组合降维方法(PCA+SIR、PCA+SAVE、PLS+SIR和PLS+SAVE)进行了考察。结果从判别模型的预测效果、预测结果的稳定性及敏感性来看,PLS优于PCA,PLS+SIR/SAVE的组合降维效果更佳。结论用t计分法选维,以"PLS+SIR/SAVE"法进行降维的两阶段组合降维策略,对于微阵列数据判别分析,是实用的、可行的。
其他文献
<正>从我国短跑100米水平与世界100米的差距引发思考,通过查阅资料和对资料的综合分析,提出"后蹬跑"作为100米后蹬技术的专门性练习,随着后蹬技术的改变(后蹬充分蹬直技术向
应用数值模拟方法对中心锥中心进气混压式进气道的喘振现象进行了研究。在数值计算的基础上,根据进气道出口截面每个网格点的压力、密度、速度等参数计算了进气道喘振过程中
由于经济发展水平、地理位置和城镇化模式的不同,福建省城镇化区域差异较为明显。基于2005—2012年福建省9个地级市的统计数据,运用泰尔指数测度了2005—2012年内闽东南和闽
现阶段,4G移动通信网络是我国最先进的通信方式之一,为我们的生活带来了更大的便捷性。然而,由于其自身所特有的移动性与复杂性,使得其在发展过程中也出现了许多问题。为了能
介绍了亚麻籽的化学成份、有害物质以及亚麻籽粉(粕)、亚麻籽油的保健功效,并介绍了选择与传统溶剂不同的两相溶剂系统分离有毒成份生氰葡糖苷的新方法。对分离效果以及影响分离
本文选择若干具有代表性的国家,简要介绍这些国家的自然保护区立法、管理体制及主要管理制度方面的情况;并通过比较分析,剖析国外自然保护区立法等方面的共同性和趋势。
<正>"黯然销魂者,唯别而已矣。"古往今来,多少文人骚客因为离别而伤心不已,潸然泪下。在唐诗这片璀璨的星空中,送别诗永远是一颗耀眼的星座。近年来高考中诗词赏析题中送别诗
加入世贸组织后,我国的体育用品业面临着世界各大品牌抢占国内市场的挑战,而目前我国的体育用品品牌国际竞争力还比较弱。针对这一情况,在借鉴了世界第一大运动品牌NIKE的成
一项新研究结果表明,使用他汀类药(本研究用的是斯伐他汀(simvastatin))对认知功能有很小的不良影响。“尽管对认知功能的影响太小了,没有任何立即的临床意义,但它确实表明(