【摘 要】
:
随着大数据时代的到来,越来越多的超高维数据被应用于科学研究的各个领域。对于超高维数据进行特征筛选成为了统计学家们热衷研究的课题。在前人研究的基础上,本文提出了一种
论文部分内容阅读
随着大数据时代的到来,越来越多的超高维数据被应用于科学研究的各个领域。对于超高维数据进行特征筛选成为了统计学家们热衷研究的课题。在前人研究的基础上,本文提出了一种新的无模型特征筛选方法,放宽了之前的特征筛选方法对于模型的限制,从而能够应用于自变量对因变量的影响与另一个变量(相依变量)有关的情形。这种方法将因变量的示性函数与自变量之间的条件相关系数作为每个解释变量的边际得分函数来衡量他们的重要程度。我们运用核平滑法对自变量的边际效用进行估计并得到样本形式下的筛选标准。在对每个解释变量对应的筛选标准进行排序后选出排在前面的部分解释变量作为活跃解释变量进入到子模型中。本文还介绍并证明了这种新的特征筛选方法具有确保筛选性以及秩相合性,保证重要解释变量能够排在前面并且全部进入子模型中。本文构造了四种不同的模型框架,每种情形都通过蒙特卡洛模拟将我们的方法与前人提出的其他三种特征筛选方法进行对比,从而验证了我们这种方法的理论性质,并且证实了该方法在十分广泛的模型框架下有效。最后我们还将这种方法应用于人类乳腺癌数据进行了实证分析,挑选出了与乳腺癌患者腋窝淋巴结转移最相关的几个基因。最终我们得出结论,这种方法可以在不限定模型具体形式的情况下对存在相依变量的超高维数据进行特征筛选,这在已有的其他特征筛选方法中还未实现过。
其他文献
畸形蒜的种类很多,根据几种常见的畸形蒜,对它们的产生原因和防治措施作一简要的阐述.包括马尾蒜、面包蒜、独头蒜、复瓣蒜、散瓣蒜,它们的产生原因多是由于种子本身的因素、
仿人机器人的结构仿照人类设计,相比轮式机器人,在复杂地形和恶劣的环境中拥有更强的适应能力。但目前仿人机器人的脚部结构仍比较简单,多种功能比较缺乏,导致未能发挥仿人机
根据进修生的特点,充分运用现代化教学手段,不断强化临床实践,提高进修人员理论水平,同时加强职业道德的培养,强化法制观念,为基层医院培养优秀的医疗骨干和学科带头人做出应
【正】用户平时在网络上无论是购物、租房,还是前往网络交友注册实名用户,都需要填写自己真实号码通过验证,但是这样做的风险却是很有可能遭遇意想不到的骚扰。如果用户不想
随着语言教学研究对个体差异的重视,学习风格作为其中一个重要组成部分,受到了越来越多的关注。在建立以“学生为中心”的教学模式过程中,既要依据各地区的实际情况,又要关注
随着对机械结构的功能要求不断提高,仅靠刚性结构已经不能满足3C产品装配的要求,柔顺机构因其体积小、重量轻、无摩擦等优点正在不断代替一些刚性结构实现装配的功能。柔顺机
【正】对于"锋芒"的定义,摩托罗拉总有着自己独到的见解。2004年有着"航空铝合金超薄机身"与"镭射激光键盘"的V3刮起的超薄金属风让多少人一见倾心;7年后,摩托罗拉复活了当年
清華簡《繫年》以晉楚爭霸為主線,記載了西周初年到戰國初期的史事,時間跨度大,涉及史事眾多,對於補充傳世文獻史料之不足、佐證先秦史書有著重要的史料價值和學術價值。目前學界對清華簡《繫年》的研究多集中在文字考釋、內容疏證、體例、成書時間等方面,雖取得了一定成果,但有關問題的討論仍多有值得繼續深入的地方;另外,學界對《繫年》史學成就等相關問題則關注不足,也有待繼續發掘。因此,本文計劃從文獻學角度出發,對