基于关系数据库插件的化学结构数据库

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:chyfandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
化学结构数据库的建立与应用历来广受研究人员重视,现已成为化学各学科研究的基本支撑平台。本文使用关系数据库插件技术设计、构建了化学结构数据库,并对化学结构信息的存储、子结构检索效率进行了研究。   本文在数据库管理系统Oracle11g的环境下,安装OrChem和Bingo关系数据库插件,以PubChem Compound SDF文件为数据源,设计化学结构数据库化合物基本结构信息表,建立了包含约40万种化合物的化学结构数据库;通过使用JDBC技术实现远程数据库B/S访问,并测试使用ROWID方法实现高效的分页查询。   对关系数据库插件OrChem和Bingo表征和存储化合物二维结构信息的方式进行了对比。测试结果表明,对于包含40万种化合物的化学结构数据库,存储Molfile,Bingo比OrChem总的存储空间节省了32.5%;对于Bingo,采用SMILES和Binary时总的存储空间比Molfile节省了81.3%和78.3%;同时在功能上,Bingo还支持三维结构检索和高亮显示子结构,以及包含化学结构共振形式、互变异构体特征的多条件查询。   采用关系数据库插件能够实现分子指纹的生成、建立索引和化合物子结构检索。本文从分子指纹的构成和索引策略两方面讨论了OrChem和Bingo的主要差异,并选取10个特征化合物进行子结构检索测试。对存储40万种化合物的化学结构数据库的测试结果显示,OrChem可满足用户检索响应,Bingo则更为准确和快捷。对于存储2600万种化合物的化学结构数据库,针对Bingo通过优化Oracle数据库内存管理、数据表结构、子结构预筛选参数,显著提高了化合物子结构检索的效率。
其他文献
我国是金属镁生产的大国,年产量占全球的80%以上。但是,我国的金属镁生产几乎全部采用以白云石为原料的皮江法工艺,带来资源利用率低、能耗高、环境污染严重等诸多问题。相比
会议
会议
会议
木质纤维素资源因具有来源丰富、可再生并可转化为多种化工产品等优点而备受瞩目。在木质纤维素的众多利用途径中,生物发酵法的反应条件温和、产物得率高、对设备要求低,是目
会议
会议
学位
猪瘟是猪的重要传染病之一,给养猪业造成严重的经济损失,被世界卫生组织列为A类动物烈性传染病之一,加强对猪瘟病毒研究显得尤为重要。控制猪瘟最有效的方法是注射疫苗,目前
会议