CMRS:聚类的多解析度字符串索引结构

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:wearetian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因测序技术和人类基因组计划的发展,从大量的生物数据中寻找相似的序列就越来越成为当前研究的热点问题.本文提出了一种聚类的多解析度字符串索引结构,用于解决生物序列的相似性查询问题.首先,以较小容量的MBR(最小绑定矩形)构造基因序列的多解析度字符串索引结构,然后通过对MBR的聚类以夏保序技术的应用,减小索引中MBR的平均体积,从而增加了查询向量到索引的空间距离,提高了索引的过滤能力.还给出了一种新的后处理方法,通过大量的减少编辑距离的计算,提高索引的性能.文中给出了该索引结构并详细介绍了索引的相关算法.
其他文献
园林子北山锡多金属矿位于沙胡同次火山岩体东部边缘和园林子岩体北西侧外接触带部位.其内残存有二叠系林西组(P2l)地层,锡矿体主要产在霏细斑岩破碎蚀变带中,是一套海陆交互相
淖毛湖北山金矿床位于新疆东准噶尔东部重要的金及多金属成矿带—唐巴拉-卡拉麦里成矿带,产于含金丰度值较高的上泥盆统托让格库都克组火山碎屑岩系中;区内岩浆活动频繁,侵入
本文提出了一个柱塞泵柱塞腔压力瞬变过程的理论模型.该模型中引入了液阻、液感、液容,以及经辨识而得的随压力变化的体积弹性模量和变化的流量系数.对于不同的负载工况、不
新疆伊北煤田伊宁县苏勒萨依井田地层由老至新依次有 中生代三叠系上统小泉沟群赫家沟组 (T3h)、 侏罗系下统八道湾组(J1b) 和三工河组(J1S) 、 中统西山窑组(J2X), 新生代古近系(E)、
首先提出了一个名为状态树搜索(State-tree Search),用以计算随机流网络可靠性的算法,在此基础上提出了一个改进的算法-SS-MC(State-tree Search & Monte Carlo).状态树搜索
讨论了线性定常多变量一般系统(包括可稳系统和可控系统),在时域上用状态反馈来设计鲁棒系统的问题.用状态反馈配置系统极点时有一定的自由度.文中分析了可稳系统用状态反馈,
土壤中的钼是生态化学评价的重要内容,其测定方法有多种化学法和仪器法方法,比色法灵敏度较高,但显色要求严格,分离手续繁琐,火焰原子吸收光谱法测定时,仅有部分钼被原子化测定的灵敏度较低。近年来,使用石墨炉原子吸收光谱法可以省去分离富集操作,但仪器比较昂贵,费用高,不适于在一般实验室普及因而本文建立催化极谱法,仪器成本低,干扰少,灵敏度高,且测定结果稳定。
对新疆某氧化铜进行了浮选试验研究,采用硫化浮选法,探讨了改变加药点对氧化矿铜硫化浮选的影响,经一粗二扫三精流程,在磨矿粒度-200目80%的条件下获得了铜品位25.56%、回收率83.
记者从新疆维吾尔自治区安监局获悉,自治区安全生产委员会办公室目前下发通知,计划2014年在全区范围内整顿关闭79家落后产能金属非金属矿山。根据计划,这79家矿山关闭指标己分配
科克火热金矿位于准噶尔界山华力西褶皱带扎依尔一达尔布特复向斜东段南翼,产于沉积岩及侵入岩中,有一套中-高温的矿物共生组合和围岩蚀变,金的粒度多为次显微一显微级。历经多