互关联后继树相关论文
该文的主要目的是对Web日志挖掘做进一步的研究,并提出新的挖掘方法.论文首先探讨如何有效的将原始Web日志转化为用户事务;然后介......
关联规则(association rules)在数据挖掘是一个重要的研究内容.而产生频繁集(frequent items)则是产生关联规则的第一步.在大多数......
文本分词和特征表示是文本处理领域的两个重要问题。本文在这两个问题上提出了新的见解,并且在文本分类的应用环境中对提出的方法进......
随着信息时代的数据,特别是非结构化数据的爆增,人类从中获取信息的需求也越来越大,如何从全文中获得信息,是一个传统的关系型数据库系......
全文检索技术已经在企业信息门户等领域有了广泛的应用。然而,目前大部分全文检索系统是面向静态数据库或半动态数据库的,即信息一......
随着信息时代的到来,人们需要处理的数据飞速增长,大量的数据要进行存储与检索。数据不但占用海量的存储空间,而且对其检索也需花费大......
随着“信息爆炸时代”的来临,如何更快、更准、更方便的搜寻到数据已经成为了当代社会关注的焦点。在这种需求的刺激下,搜索引擎技术......
现代社会的信息量呈爆发性地增长,数据库技术成为有效地管理这些信息的主要方法。数据可以分为三种类型:结构化、半结构化和无结构化......
随着人类社会进入“信息时代”,信息记录的形式已由纸张演变为电子形式,而对于信息的检索也由计算机代替了人工方式。在存储、检索和......
随着计算机产业的发展,以计算机存储设备为载体的电子信息愈来愈多,这些信息大致可分为两类:结构化数据和非结构化数据,结构化数据......
全文索引的显著特点就是提供对非结构化海量数据的管理和快速查询。全文索引创建的空间效率和索引建好后的查询速度是全文索引研究......
随着计算机技术的迅速发展,信息越来越呈现出海量化和多样化的特征。传统的信息检索技术只擅长处理结构化数据,为处理大规模文本等......
时间序列是现实生活中常见的数据形式之一.在时间序列中发现频繁模式是分析时间序列变化规律的一项重要任务本文提出一种基于互关......
提出一种建立在集群式高性能计算机上基于互关联后继树的并行时序模式挖掘算法,将数据线段化、树的建立及模式发现在多处理机上进......
主要提出了使用互关联后继树来实现文本压缩的方法。利用互关联后继树的检索功能可以方便地查找最长匹配串.从而达到更好的文本压缩......
本文详细研究了互关联后继树技术在中国电信黄页搜索引擎系统中的应用。其技术核心是互关联后继树全文索引模型,它能够较好地满足......
介绍了一种新型的全文数据库模型--互关联后继树,阐述它与其它全文数据库模型相比在呈现非结构化信息的存储和检索中的巨大优势,并......
全文检索系统的重心是全文索引,全文检索的动态性取决于全文索引创建和更新的动态性.本文在对互关联后继树模型研究的基础上,借用......
针对全文检索领域的索引结构模型的研究,基于三元互关联后继树模型,提出并实现了一个存储结构良好的索引系统。利用该系统实现了多......
半结构化数据与文本数据的异构性导致了它们的索引结构很难一致,因此在XML文档中树型结构索引和文本部分索引的联合创建与协同查询......
针对全文检索领域的索引结构模型的研究,基于后继有序的互关联后继树模型,提出并实现了多库合并建库算法,这大大增加了可建索引库......
针对二元的互关联后继树模型进行改进,构造三元互关联后继树,并结合Web日志的特点,构造Web事务集的互关联后继树和增量更新模型,设......
研究针对全文检索领域的索引结构模型,基于二元互关联后继树模型,提出并实现了一个后继序列有序的后继树模型,然后利用此索引模型......
对基因数据库的一种常见操作是找到与待查询序列相似的序列.目前常使用的是BLAST算法,但是这种启发式算法有时会漏解.如果使用精确匹......
在多核处理器平台上,针对互关联后继树索引模型,采用OpenMP指导语句对其创建算法进行改进优化。通过与未优化的串行程序结果进行比较......
以往文本过滤的研究主要集中于主题性过滤,然而随着网络的发展,倾向性文本过滤在网络信息安全方面的作用越来越大。论文阐述了一个倾......
提出了一种新的根树节点编码方法--基于叶序区间的节点编码(LOINS).编码方法只需对根树后序遍历一次即可完成,能实现常数时间内对......
概念格是知识工程中一个重要的知识表达工具,同时也是形式概念分析的核心.目前已出现了许多有效的概念格构造算法.提出了一个基于......
时间序列的相似性查询是分析时间序列变化规律的一种重要方法,对于时间序列的分类、预测以及知识发现都具有重要的现实意义.提出了......
本文将互关联后继树 (Inter RelatedSuffixTree ,IRST)模型应用于Web日志事务挖掘 ,构造Web日志事务集的互关联后继树结构 ,从中挖......
在文献[1]中提出的基于互关联后继树(IRST)的时间序列特征模式挖掘方法的基础上,加入了时间窗口的概念,以弥补IRST这种原本应用于文......
时间序列是现实生活中常见的数据形式之一,在时间序列中发现频繁模式是分析时间序列变化规律的一项重要任务.提出基于互关联后继树......
在全文检索中,要使索引具有较好的灵活性,就需有合适的索引结构及更新策略,使得既能有效地实现索引更新,又不影响查询效率。本文设计了......
在分析现有文本零水印缺陷的基础上,该文提出了基于字符频度点积的数字零水印的思想,为了能提取更能体现文本特征的字符,该文研究......
介绍了一种能够统一地索引全文数据与XML树型结构数据的模型——互关联后继树,提出了后继模式树的概念,使用后继模式树有效地处理了X......
全文检索领域的关键问题是索引模型以及该模型之上的高效搜索算法,基于一种优秀的全文索引模型互关联后继树提出了基于后继区间的......
数学表达式结构复杂多样,给检索带来困难。为此,提出一种数学表达式索引与检索方法。在索引阶段,通过对LaTeX数学表达式特点的分析与......
随着Internet的快速发展,XML已成为Web数据表示和交换的新标准,越来越多的信息处理系统采用XML文档作为信息存储、交换和发布的载......
随着计算机系统性能的提高,互联网络技术的快速普及,以及企业信息化程度的提高,中文信息资源以极快的速度递增。信息检索就是从庞大的......
为快速准确地查询图结构XML文档,本文在互关联后继树(IRST)的基础上,引入结构索引的相似性归并思想,提出一种基于互关联后继树且支持分......
随着信息时代的到来和Internet的日益普及,文本信息迅速膨胀,使得文档数据库技术成为信息技术领域的一个重要研究方向。文档数据库是......
全文检索是一种非常有效的信息检索技术,本文通过分析全文检索系统中静态索引技术的优缺点,以及影响动态性能的因素,提出一种基于互关......