论文部分内容阅读
蛋白质组学是后基因组时代的一门学科,它研究如何识别和量化的蛋白质,并描述其功能,结构和相互作用。蛋白质组学的研究目标使其相对于其它学科更需要有效的组织和获取之前的实验或者理论文献和数据。双向电泳是蛋白质组学研究的一种重要手段,一方面可以与各种鉴定方法,如质谱相结合,系统地鉴定样品中的蛋白质,另一方面可以用来比较相关的样品中的蛋白质,如健康与病变组织的蛋白质,或者同一组织中的蛋白质在不同环境条件下的表达量变化情况,被广泛用于蛋白质组学研究中。因此,对于双向电泳数据的有效整理和归纳在蛋白质组学研究中是一个重要的问题。开发和实现各种工具,以有效的访问和管理各种不同类型的生物学信息是生物信息学的研究方向之一。蛋白质数据库作为分子生物学中最早创建的数据资源,如今已包含了非常丰富的内容。了解并能自如的运用这些资源对于蛋白质组学的研究工作,尤其是新的蛋白质组学数据库的建立是很有必要的。另外,数据库的建立也需要参照一些国际通用的标准,以方便其它研究者的查询和引用。家蚕作为鳞翅目昆虫理想的模式生物,已经建立完成了基因组精细图谱,并且也积累了蛋白质组学研究,尤其是双向凝胶电泳上的许多数据。将这些数据归类整理并建库,对家蚕蛋白质组学研究有着非常重要的意义。因此,我们建立了家蚕蛋白质数据库系统(SWPDB),在吸收同类型数据系统的特点基础上,基于MySQL关系数据库软件,Ruby语言和Rails框架,对双向电泳实验和图谱,LC-MS/MS实验,和鉴定得到的蛋白质的数据实现了快速录入,编辑已有数据,和数据展示,查询功能。并且,数据库实现了与家蚕基因组数据库SilkDB2.0的整合和NCBI蛋白质数据索引的交叉引用功能。同时数据库系统具有良好的权限控制粒度,可以设定用户对数据库中数据的编辑,添加,或者查看的权限;数据库也集成了本地化的功能,可以将网页以不同语言提供给用户使用。同时,我们已经收录了家蚕大造品种(P50)胚胎形成期的卵,5龄第3天中部,后部丝腺,血液,中肠,表皮,气管,精巢,5龄第5天马氏管,5龄第5天,上蔟第2天脂肪体,和化蛹第1天马氏管,化蛹第1天,化蛾第1天精巢,蛾期鳞毛,以及丝腺突变品种Ndx,21-872的第5天幼虫后部丝腺等家蚕组织器官。总共涵盖了23张电泳图谱和2312个蛋白质的相关信息数据。最后我们以热激蛋白为例检索蛋白相关数据查询为例,展示了数据库的使用方法和查询功能。