非线性降维在高维医学数据处理中的应用

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:xinglink
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对非线性高维医学数据降维的困难,引入了一种新的非线性降维方法Isomap,并从算法原理的角度讨论了方法在医学数据处理中的适用性。该文将Isomap应用在两个典型医学数据集(肺癌基因表达数据和乳腺癌病理数据)的分析中,发现它们的本质维数都低于3,因而可以得到在低维投影空间中的可视化表示。实验进一步将Isomap和主成份分析(PCA)的投影结果相比较,并统计类内距离,结果显示Isomap优于传统的线性降维技术。这说明了非线性降维技术在高维医学数据分析中的潜力。 Aiming at the difficulty of dimensionality reduction in nonlinear high-dimensional medical data, a new nonlinear dimensionality reduction method, Isomap, is introduced and the applicability of the method in medical data processing is discussed from the perspective of algorithmic principle. In this paper, Isomap is applied to the analysis of two typical medical datasets (lung cancer gene expression data and breast cancer pathology data) and found that their intrinsic dimensions are less than 3, so that the visual representation in low-dimensional projection space can be obtained . The experiment further compares the projection results of Isomap and principal component analysis (PCA), and calculates the intra-class distance. The results show that Isomap is superior to the traditional linear dimensionality reduction technique. This illustrates the potential of non-linear dimensionality reduction in high-dimensional medical data analysis.
其他文献
子午沙鼠 ( Merionesmeridianus)是荒漠和半荒漠地区常见的鼠种之一。作者于 1 991~ 1 996年 4~ 1 0月每月中旬 ,在内蒙古达拉特旗中国农业科学院草原研究所鄂尔多斯沙地草场改良试验站。利用直线夹日法在站内的流动沙丘、半流动沙丘、固定沙地、丘间滩地、林地和农田中开展了种群数量调查。 6a共布放 1 2 4 2 4 5个夹日 ,捕获鼠 74 98只 ,其中子午沙鼠1 4
以平板双分子层脂膜作为生物膜的简单模型,建立用平板双分子层脂膜电性质研究药物-生物膜相互作用的方法.研究以具有典型特征的物质-表面活性剂、自由基、金属手性配合物与平
研究自发性高血压大鼠(spontaneously hypertensive rats, SHR)心脏L-精氨酸/一氧化氮(L-Arg/NO)系统的改变及其与红细胞L-Arg转运的关系.检测12周龄(W)、16W、captopril 治
应用RFLP技术,研究了红莲型不育系、保持系、杂种一代及野败型、马协型不育系的线粒体基因组.结果表明,红莲型不育系与保持系线粒体基因组之间在多个基因区域存在明显差异,为
采用Cohn氏6法[1]低温乙醇工艺分离人血浆制备白蛋白过程中,约有10%的白蛋白残留在组分Ⅳ(FⅣ)沉淀中[2].提取FⅣ中的白蛋白的工艺已有多个学者提出,其中EJ Wye等[3]提出经典
报道了采自我国四川省雅安的蝇科秽蝇属二新种,均具触角较短、雄蝇阳基后突较弱、肛尾叶和侧尾叶细长等特征,应隶属白角秽蝇种团(Coenosia albicornis-group),模式标本保存于
目的克隆与结核分支杆菌耐异烟肼密切相关的KatG基因,实现其在大肠杆菌中的表达并对其酶活性进行初步检测。方法构建含KatG基因的表达质粒pET24b-KatG,转化大肠杆菌BL21(DE3)菌
采用氧化亚铁硫杆菌(Thiobacillw ferrooxidans,简称T.f.菌)作为出发菌株,应用He-Ne激光进行辐照诱变研究及浸矿工艺影响参数的研究.
目的 介绍差异竞争性多聚酶链反应(differentially  competitive PCR,DC-PCR),并分析癌基因 HER2和C-myc变异与胃癌生物学行为的关系。方法用DC-PCR定量检测胃原发癌、癌旁、转移淋巴结及远处脏器转移癌中HER2和C-myc扩增。结果 HER2扩增频率
建立了平板结构在点力载荷和线力载荷作用下振动响应的理论模型,应用该模型计算出简支平板在两种载荷作用下的振动响应,然后进行比较分析.通过实验研究了点力载荷与实际惯性