用于癌症诊断的基因芯片数据的降维和分类方法

来源 :2005中国计算机大会 | 被引量 : 0次 | 上传用户:johntoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片技术的发展,使生物医学领域的研究进入了崭新的时代。利用癌症病人样本制得的基因芯片,可将不同种类的癌症进行快速准确地分类,这对于癌症的早期诊断和及时治疗都有重要意义。本文既采用了经典的显著性检验方法 t 检验进行重要基因选取,又创新性地利用非线性数据分析方法核映射进行数据转换,在保存全部基因信息的前提下,融入样本信息,有效地降维。借助人工神经网络自组织映射(Self-Organizing Map, SOM)建模预报,获得了令人满意的分类结果。最后利用 Leave One Out(LOO)等方法验证降维的有效性和分类器的稳定性,并用基因芯片数据可视化软件 TREEVIEW 讨论重要基因对分类的影响。
其他文献
互模拟的逻辑特征是进程代数研究中的重要内容之一。指标互模拟是最近提出的用于描述进程近似等价的概念。由于指标互模拟在度量ρ不要求为超度量时一般不是等价关系,因而传统
在无线传感器网络中引入分簇可以节省能量和提高扩展性。传统的分簇大部分是星状的,而最近的研究则引进了一种环状簇的结构。本文改进了这种环状簇的构造方法,并根据传感器网络
本文提出多 Agent 系统分布式问题求解的一种新的广义粒子模型,将复杂环境下多 Agent 系统资源分配和任务规划的优化问题,转变为广义粒子模型中的粒子运动学和动力学问题1。广
会议
对于媒体数据(RTP/UDP/IP)在使用标准IP协议栈处理时,系统中UDP数据的处理效率低会导致系统性能瓶颈。针对该问题,基于三层交换设备的工作原理,提出了网络数据分类优化处理机制—
会议
实现灵活方便的企业业务集成一直是信息领域的核心问题,也是 B2B 电子商务应用的关键。解决企业业务集成的一种新方法就是基于 Web 服务的工作流。为了使工作流系统更加方便高
研究复杂疾病的机理并进行疾病的诊断预测是生物信息学中重要的问题之一。已有很多文献通过研究人类基因组上 SNP 标记与复杂疾病的关系来研究这一课题。本文提出了一种新的
会议
CPU的性能体现了计算机发展的程度,是信息社会发展的重要标志。然而,近来自 Pentium IV推出后,CPU 的发展似乎停滞。是什么影响了 CPU的进一步发展,CPU 将何去何从?业内人士给了许
本文针对约束求解算法的测试问题,研究了当前用于测试算法的各种典型约束满足问题的生成模型,分析了各种模型的特点,提出了扩展的RCSP生成模型以及问题实例的生成办法,给出了一种
会议
目前网络安全主要考虑来自外部的攻击,本文采取从内部源头上进行安全防护的方法,提出了基于端用户的代理系统,该系统对端用户访问外部网络实施有效管理和控制。通过建立小型的 C
会议
从句子的格形式入手,在梳理日本传统国语学、动词语义学、认知语言学观点的基础上围绕日语的“に—が”构式对日语中构式义、动词义和名词义的关系展开分析。结果发现:第一,