基于代谢组学数据特征的稳健的变量选择方法研究

来源 :中国化学会第14 届全国计算(机)化学学术会议暨分子模拟国际论坛 | 被引量 : 0次 | 上传用户:Liujc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  代谢组学数据具有维度高、干扰变量多、类不平衡等特点。偏最小二乘-判别分析法(Partial least squares-discriminantanalysis,PLS-DA)是目前在代谢组学研究中应用最为广泛的一种分类方法。
其他文献
Understanding of cholesteric liquid crystals from molecular level is challenging.Limited insights are available to bridge between molecular structural information and macroscopic chiral organization.
First principle density functional theory calculations are used to study the chiral self-assembly of phenylalanine on Au(111).
Ensemble strategies have gained increasing attention in multivariate calibration for quantitative analysis of complex samples[1].
化学计量学和化学信息学研究的一个重要目标是建立一个有效并可靠的化学模型,以对未知的化学样本的浓度/性质等进行准确预测。由于模型f(。)为完全未知的软模型,不确定性很高。
作为化学计量学中的一类重要方法,多元校正与分辨方法不仅在分析化学邻域有着广泛的应用,并已成功用于食品科学以及环境科学的定性、定量分析当中。然而,在临床样本分析方面,由于受到临床样本的复杂性以及样本收集不易等的限制,还未能得到有效应用。
组织中特定蛋白质如果发生错误折叠,将会发生自组装形成难溶的纤维聚集体在脑部沉积,引发如阿尔茨海默病、Ⅱ 型糖尿病等“蛋白质构象病”。蛋白质错误折叠所导致的构象病给社会公共卫生带来了严峻的压力,研究蛋白质错误折叠机制对疾病的认识与治疗具有重要意义。
联合10家共同实验室,对8个烟草样品分别用水和乙酸萃取、用连续流动(硫氰酸钾)法(NM法)替代高毒性氰化钾法(CRM35法)提取总植物碱,8个烟草样品的总植物碱含量为1.00%~5.00%.
近红外光谱分析技术以其快速、无损和无需预处理等特点被广泛应用在食品、卫生、石油等领域。随着化学计量学的发展,该技术逐渐被用于临床疾病诊断的研究。
寡肽作为蛋白质的片段和结构单元,已经被广泛用作模型来研究蛋白质的性质。研究寡肽的水合作用有助于我们进一步了解蛋白质在水溶液中的性能。本文利用温控近红外光谱结合独立成分分析,以水分子为探针[1]研究寡肽Asp-Asp-Asp-Asp-Asp(D5)在水溶液中的水合作用。
深入了解煤热解反应机理对实现煤的高效和清洁利用至关重要。影响煤热解化学反应的主要影响因素包括温度、颗粒内的孔道、煤颗粒表面结构、反应气氛、升温速率等等。