XML信息检索探究

来源 :情报学报 | 被引量 : 0次 | 上传用户:shliukan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML文档是具有层次结构和文本内容的半结构化数据。现有的Web信息检索是基于HTML文档的关键词全文检索,无法胜任XML元素粒度的检索;同时,XML数据库检索实现的是精确查找,检索结果无排序支持。因此,融合信息检索和数据库技术研究XML检索问题成为必然。本文从XML检索的问题域出发,阐述了XML信息检索(xMLIR)的国内外研究现状与特点,并分析了目前XML IR的热点和难点问题。
其他文献
传统方法处理文本分类时都需要进行文本训练,并且在文本表示时需要抽取特征项。搜集训练文本的过程需要费时费力的人工参与,而且中文信息的特征项抽取工作难度较大。为了解决这
专利引文分析是专利情报分析的重要组成部分,但由于引文分析方法本身的特点,如需要对不同年份、不同领域、不同地点授权的专利的被引数据进行对比,单纯利用从数据库中检索出来的
数据稀疏性是协同过滤系统面临的一个巨大挑战。本文提出了一种新的推荐算法——基于矩阵划分和兴趣方差的协同过滤算法。该算法采用矩阵分块的思想来缩小最近邻搜索的范围。
本文针对武钢烧结能耗情况,仅从配加生石灰、钢渣等添加剂方面的效果和途径;从减少返矿中的成品粒级的节能途径;从加强燃料整粒及改善燃料粒度组成等方面提出了看法。
外源DNA插入片段为40 kb左右的Fosmid文库在基因组学研究中有广泛的应用,但长期以来,40 kb外源片段的分离与纯化依赖于传统的切胶并电洗脱至透析袋的方法,难以得到足够量的DN
目的探讨强直性脊柱炎颈椎骨折或合并脱位的特点和外科治疗过程中应该注意的问题。方法回顾性分析1998年6月至2010年10月手术治疗累及颈椎的强直性脊柱炎合并颈椎骨折或脱位1
本文以1987年6月在法国召开的第四届国际轧钢会议上的交流资料为题材,综合评述了冷轧带钢技术在全连续式生产、板形与辊形的测控及仿真研究、厚度自动控制及冷轧机震动等方面
专利计量虽然在1994年才被提出,但是其在经济学、科学计量学等领域产生了广泛的影响。本文试图通过从宏观、中观、微观三个层次分别构建了专利计量的指标体系,并通过对全球有机
期刊
本文基于2011—2015年我国纺织品服装出口数据,回顾和总结"十二五"期间我国纺织品服装出口发展特征,分析"十三五"期间我国纺织品服装出口贸易面临的主要挑战,认为我国纺织品