半结构化中文信息检索中查询结果相关度算法的研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:L936355705
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了对富含文本信息的XML数据进行基于关键字的查询时,查询结果与查询条件之间相关度的计算问题,分析了利用传统信息检索技术解决该问题时存在的一些不足,提出了一种基于节点的动态的关键字权重计算法,以及综合考虑关键字在查询结果中的频率分布特征和结构分布特征的查询结果相关度计算法,有效解决了XML数据中的结构信息对相关度计算的影响,实验证明本文中的方法取得了较好的检索性能.
其他文献
2010年1月将迎来西部大开发十周年。近十年来,西部大开发取得了巨大成效,西部地区经济加快发展,基础设施明显增强,生态环境得到了更有力保护,老百姓也得到了更多实惠。为了迎
基于不定长单词的压缩模型的压缩效率高于基于字符的压缩模型,但是它的最优符号集的寻找算法是NP完全问题,本文提出了一种基于贪心算法的计算最小汉字平均熵的方法,发现一个
共现词提取在信息挖掘和自然语言处理中有着十分重要的地位.而传统的共现词提取方法仅仅局限在单一的一种统计量上,其结果十分不精确,需要人工再进行整理.本文提出了一种基于
过去30年是全球化大发展的年代,形成了统一的世界市场。国际金融危机爆发以后,其影响通过贸易、投资和金融的传导机制迅速传递到了世界的各个角落,世界所有主要国家和地区都受到