【摘 要】
:
单核苷酸多态性引起的DNA序列的改变造成了整个生物界染色体基因组的多样性,对SNP的深入研究对于识别人类基因表型和疾病关联具有重要的意义.标签SNP集的选择是生物信息学中的关键问题,少量的标签SNP所代表基因的遗传信息可以大大降低基因分型和全基因组关联研究的成本.本文详细介绍了SNP相关理论以及标签SNP集的选择方法,并针对标签SNP的应用以及未来的研究方向进行了简要分析.
【机 构】
:
山东科技大学 数学与系统科学学院,山东 青岛 266590;中国石油大学(华东)计算机科学与技术学院,山东 青岛 266580
论文部分内容阅读
单核苷酸多态性引起的DNA序列的改变造成了整个生物界染色体基因组的多样性,对SNP的深入研究对于识别人类基因表型和疾病关联具有重要的意义.标签SNP集的选择是生物信息学中的关键问题,少量的标签SNP所代表基因的遗传信息可以大大降低基因分型和全基因组关联研究的成本.本文详细介绍了SNP相关理论以及标签SNP集的选择方法,并针对标签SNP的应用以及未来的研究方向进行了简要分析.
其他文献
根据泛函积分方法研究随机散射通道模型中传递函数的概率分布,通过引入复空间上的散射振幅密度和非Gauss型分布函数,给出概率分布中特征函数的泛函积分表示,借助于散射振幅密度的Shift变换和微扰展开技术推导概率分布矩阵元的修正表达式.这些矩阵元对应的方差和协方差,可分别描述随机变量的涨落和关联效应.另外,当散射振幅密度的关联函数取为Dirac-δ函数形式时,并且振荡指数和外源作用系数确定后,计算修正矩阵元和相关系数的具体数值,讨论这些矩阵元的物理含义和变化趋势,还分析外源作用下随机变量的关联性质.结果表明修
应用基于密度泛函理论的第一性原理赝势理论,采用近似方法建立Au-Ag互以(100)面结合的共格界面模型,并定量计算该界面能的大小为0.0741 J/m2.
机器学习是人工智能领域发展最迅速的一个分支之一,传统的机器学习方法和深度学习大都需要大量人工标注的训练数据才能发挥作用.然而,现实世界的物体种类繁多且其数量在不断增长,人工标注训练数据就变成了一项极其繁琐冗杂的工作,零样本学习的提出极大地缓解了这种情况.在零样本学习中,训练集和测试集的类别的交集是空集,因此需要在二者之间通过实现知识的迁移来完成学习,从而使得在训练集上训练得到的模型能够识别测试集上输入示例的类别标签.不同于其他大部分机器学习技术需要保证训练集包含测试集,零样本学习的原理从本质意义上让计算机
可转债是一种复杂的金融衍生工具,其定价受到学界与业界的广泛关注.目前主流的TF98定价模型对我国可转债定价的适用性有一定局限.本文利用收缩回归对我国2019年和2020年上市的两百余只可转债建模并分析,对比了回归模型与TF98定价模型的结果,分析了传统定价模型的局限性,并验证了回归模型的定价有效性.本文回归模型的拟合优度大于0.77,回归模型在测试集上的定价精度和定价稳定性明显优于传统定价模型.
根据能量守恒和热量变化规律,建立了跑步减重的两个新的差分方程模型.首先,引入计算基础代谢的Liu公式,对基本模型做进一步的细化,得到一个改进的一阶线性差分方程模型;然后,基于BMI指数与跑步速度关系建立了另一个改进的一阶非线性差分方程模型,对两个改进的模型进行稳定性分析,得到模型存在稳定解的条件,并进行了解析和数值的求解计算;最后,分析了运动时间、热量消耗对体重变化的影响,结果表明改进后的模型更贴合实际情况.
联系的观点不仅十分基本,而且十分重要.把握联系观点不仅有利于深刻理解教学的本质,而且可以为教学研究指明方向.教学难点分析作为教学研究的重要方面之一,当然也离不开联系观点的指导.从联系的途径看,教学难点可以从联系的起点、目标、方法和线索等方面去分析;而从联系方法看,教学难点的分析可以采用结构分析法、心理分析法、反馈分析法、HPM分析法及例习题推断法等方法.
随着机器学习和生物信息学的快速发展,癌症亚型分类成为当前研究热点之一.根据亚型的分类,可以指导癌症的治疗和预后.近年来,许多监督学习方法被用于癌症亚型分类.考虑到高维、样本数量少和数据不均衡等特点,本文首先利用LDA进行降维,其次利用SMOTE算法均衡数据,再利用Extra-Trees模型对癌症亚型进行分类,最后基于TCGA中9种癌症25种癌症亚型的3296个样本来验证模型的有效性.实验结果表明,利用给出的模型进行癌症亚型分类具有很好的效果.
针对马赛克瓷砖选色问题,讨论对于给定的原始颜色,在有限种颜色的瓷砖中选出合适瓷砖的模型与方法,以及新增其他颜色瓷砖时可采取的策略.最后对2021年“华中杯”大学生数学建模挑战赛A题参赛论文的整体情况予以简要评述.
上市公司财务造假是一种违规行为,对其精确、有依据的预测有一定的研究价值.使用多种统计方法提取特征,并结合经济学意义得到了最终特征集.针对数据的不平衡问题,采用过采样、欠采样以及SMOTE采样等方法进行处理.最后采用3种神经网络模型融合的方法,以AUC值为评价指标来预测财务造假的上市公司.
探讨一类带第二类边界条件的一维热传导方程逆时问题,首先利用分离变量法推导了反问题的积分表达形式,然后基于解析延拓技术,证明了基于稀疏附加数据下反问题的唯一性,并对反问题的不适定性进行说明,接着利用线性叠加原理及有限元插值技术,给出了该逆时反演问题对应的离散反演方程组形式,借助于Tikhonov正则化方法和正则化参数选取的广义交叉验证准则,设计出了该逆时反演问题的直接反演算法,最后通过数值算例说明所设计的直接反演算法是有效的.