基于Web Services生物信息挖掘算法设计与实现

来源 :中南大学 | 被引量 : 0次 | 上传用户:huyanlongbad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web Services是一种面向服务的体系结构,其突出优点是实现了真正意义上的平台独立性和语言独立性。本文采用Web Services的解决方案,开发了一个生物信息挖掘的原型系统,封装了基于基因表达谱数据的关联规则挖掘模块和启动子识别模块,并将算法作为Web服务公开发布。系统中基因表达谱关联规则挖掘模块采用了数据挖掘中的FP-tree算法。实验表明,基于FP-tree的基因表达谱关联规则挖掘算法大大提高了运行效率,运行时间由原来的25小时变成了1.045秒。启动子识别模块实现了基于马尔可夫模型的启动子预测算法,结合隐马尔可夫模型中的前向算法,改进基于马尔可夫理论的启动子预测方法。单纯使用马尔可夫模型平均分类正确度为84.33%,改进后平均分类正确度为85.17%。改进的马尔可夫模型的预测结果显示,以此模型建立的系统能更有效的识别数据集中的三种序列。同时在启动子预测算法的基础上,研究了结合支持向量机和非线性方法的DNA数据特征提取。利用生物信息学中生物功能基团RY和结构基团MK之间的长程相关进行进一步研究,这种方法更符合生物学特性。Web Services技术作为一种中间层去处理生物信息数据。将算法部分封装在Web Services中,对外只提供用户调用算法接口,可以集成更多功能,具有可扩展性。基于Web Services生物信息挖掘方法能够挖掘出基因表达谱数据中具有生物学意义的关联规则,能够更好的识别启动子序列。为生物和医药技术企业与研究人员提供交流信息的窗口,提供简便快捷的服务平台。
其他文献
数学思想是对数学知识和方法本质的认识,数学方法是解决数学问题、体现数学思想的手段和工具。数学思想方法是数学基础知识的精髓,是形成学生的良好的认识结构的纽带,是由知
农产品是关系国计民生的物资,能否及时供应,不仅关系到社会大众的生活及生活水平的提高,还关系到市场的供给关系、物价涨跌,甚至还关系到农民及相关行业人员收入高低的问题。
随着我国经济改革的不断深化,中小型企业特别是高新科技企业得到迅猛发展,但是随之而来的是融资困难等一系列发展瓶颈问题。风险投资业的兴起对于解决融资困境问题发挥了重要的
本试验选用了我国广泛栽培的枣品种——冬枣和酸枣做为试验材料,对枣组织培养技术进行了研究,主要研究结果如下:1.确定了枣组织培养外植体的最佳消毒方法。本文按采集时间依次将
目的通过对原沈阳铁路局中心医院的调查,了解其转制的原因、过程;探讨领导体制、医院文化、人才队伍和补偿机制四个方面对分离国有企业医院的影响;科学分析企业医院在转制之后参
桩基在桥梁工程中应用广泛,但已有的桩基竖向承载力计算理论与其实际受力性状差别较大,还有待进一步研究,桩基承载力及桩土相互作用体系检测与分析方法的研究具有重要的现实意义
本论文补充研究了几种SBR胶料的结构与性能,发现St%:25~30%,Bv%控制在30~50%的SSBR胶料能满足胎面胶综合性能要求,SSBR胶料充油后,胶料的加工性能能得到明显改善,而其力学性能对填料品种
<正>他们与我无关——王清丽艺术展研讨会策展人、学术主持:冀少峰嘉宾:卢缓、徐可、谢慕、李定民、彭肜、杨小彦、殷双喜、孙振华、鲁虹、冯原、吴鸿、胡莺、夏梓展期:2014
目的通过分析不同种质来源孩儿参ITS序列,为孩儿参种内鉴别提供DNA分子标记。方法利用特异性引物进行PCR扩增、克隆和测序,对孩儿参的rDNA ITS区间碱基序列进行测定,比较其差
随着中国手机用户的快速增长,短信成为人们之间交流的一种重要方式,同时,短信也以其快捷,无时空限制,低成本的优势受到越来越多企业的重视。目前,企业应用短信平台主要是两方面:一是