基于粗糙集理论的基因序列研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:zhouli1017
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是一种处理不确定、不完备和不精确数据的数学理论工具,在数据分析与处理领域有着广泛而重要的应用。生物信息学是一门结合了数学理论、计算机科学与生物学知识的新兴交叉学科,其目的是致力于对生物信息的获取手段、处理方法、存储方式进行研究,分析和解释大量生物学数据背后所包含的生物学意义以及应用,生物信息学目前已成为世界交叉学科研究领域的一个新热点。本文基于粗糙集理论,主要对生物信息学中涉及DNA序列的启动子与基因表达序列数据进行研究。粗糙集理论在启动子序列研究中具有独特的优势。启动子识别研究从生物学实验手段随着高效计算能力的计算机出现而转到了计算机模拟识别。启动子是指导基因转录起始重要作用的序列段,在DNA序列中可能处于多个位置。在DNA序列中寻找确切的启动子位置具有一定的困难,应用统计学知识、粗糙集理论中信息系统的约简与规则获取方法,可以对不确定启动子位置进行分析、识别并预测一段DNA序列中存在启动子的可能性。在基因表达序列的数据分析与规则获取研究中,粗糙集也具有较优表现。本文将粗糙集理论应用于基因表达谱数据分析,给出一种基于粗糙集理论与信息论的基因分析与选择启发式算法,处理大基因数据集中存在冗余信息的问题,从海量基因数据集中选取了与疾病最关联的基因集合。该方法能够有效处理以基因数据信息构成的信息系统中的大量属性情况,降低去除无关联属性的成本,高效获取目的基因集合。基于该启发式算法的理论研究,在基因数据库中保留了关联基因,辅助获取基因决策表的最简规则,并向专家提供决策支持,构建辅助决策的规则知识库。本文最后在基因表达序列研究领域广泛应用的实际医疗数据集Leukemia数据集上进行了算法理论实验仿真,仿真结果进一步阐明了理论研究成果。
其他文献
目标跟踪的应用领域诸多,如人机交互、安全检测、军事视觉制导等。由于外界环境、目标本身、算法的时间性能和准确度等的影响,限制了很多目标跟踪算法的应用场景。因此,构建
互联网的迅速发展,使得网上数据不断激增。这些数据缺乏统一的、固定的模式,而且往往是不规则、经常变化的。因此,半结构化数据模型应运而生,它是介于完全结构化数据和无结构
多信道无线Mesh网络在校园、企业的成功应用,极大地提高了现有无线网络的带宽。在网络规模较小时,单信道网络的性能表现尚可。但随着无线应用规模的扩大,节点密度也不断增大,
当传统的移动设备软件已经不能满足当今信息化的需求, J2ME由于自身特有的优点,成为此类应用软件开发的主流技术。本文首先研究了课题相关的背景,国内外发展状况以及J2ME技术
随着信息技术的发展,全球范围Internet应用的普及,计算机网络越来越多的服务于人们的生产和生活,同时也给信息行业带来很多新的挑战。在众多的网络攻击事件中,由内部人员发起
动画和游戏制作是当前数字化娱乐的两个热点领域。在动画和游戏的制作过程中,时常会有按照背景音乐节拍,为角色配上合适的动作的需求。在一些强调动作和音乐合拍的应用情境下
网络安全的风险使企业和国家感到危机四伏,如何保障网络安全已成为全球关注的热点。黑客的攻击方式更加具备功利性和复杂性,以获得经济利益为主要目标,将矛头直接瞄准了台式
工业铁路货检车检在铁路运输中是一个十分重要的环节,它关系到企业能否进行安全的生产和作业,也直接影响到整个铁路的运输效率。长期以来我国工业铁路的货检车检作业都处于传
与传统的机械硬盘相比,基于闪存的固态盘具有诸多优点:性能高、能耗低、抗震强、体积小。然而,闪存厂商为了降低造价,持续地缩小闪存单元的体积并且提高每个闪存单元所存储的
高阶Voronoi图是普通Voronoi图的一种重要推广,在解决平面点集多个点的邻近问题中有着广泛的应用。然而,以往的高阶Voronoi图生成算法构造代价较高,时间复杂度较大,因而限制