半结构化中文信息检索中查询结果相关度算法的研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：L936355705

【摘要】

：

本文研究了对富含文本信息的XML数据进行基于关键字的查询时,查询结果与查询条件之间相关度的计算问题,分析了利用传统信息检索技术解决该问题时存在的一些不足,提出了一种基

【作者】

：

曲卫民孙乐孙玉芳

【机构】

：

中科院

【出处】

：

中文信息学报

【发表日期】

：

2004年4期

【关键词】

：

计算机应用中文信息处理 XML 息检索相关度算法 and a ranking function that consider both the frequen

【基金项目】

：

国家自然科学基金，国家高技术研究发展计划(863计划)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文研究了对富含文本信息的XML数据进行基于关键字的查询时,查询结果与查询条件之间相关度的计算问题,分析了利用传统信息检索技术解决该问题时存在的一些不足,提出了一种基于节点的动态的关键字权重计算法,以及综合考虑关键字在查询结果中的频率分布特征和结构分布特征的查询结果相关度计算法,有效解决了XML数据中的结构信息对相关度计算的影响,实验证明本文中的方法取得了较好的检索性能.

其他文献

以主体功能区建设推进战略、体制机制创新——兼论西部大开发战略的下一步

2010年1月将迎来西部大开发十周年。近十年来,西部大开发取得了巨大成效,西部地区经济加快发展,基础设施明显增强,生态环境得到了更有力保护,老百姓也得到了更多实惠。为了迎

期刊

西部大开发战略机制创新功能区体制西部地区经济基础设施生态环境出谋划策

基于邻接矩阵全文索引模型的文本压缩技术

基于不定长单词的压缩模型的压缩效率高于基于字符的压缩模型,但是它的最优符号集的寻找算法是NP完全问题,本文提出了一种基于贪心算法的计算最小汉字平均熵的方法,发现一个

期刊

计算机应用中文信息处理邻接矩阵文本压缩压缩模型基于不定长单词的Huffman编码computer applicationChinese infor

基于词汇吸引与排斥模型的共现词提取

共现词提取在信息挖掘和自然语言处理中有着十分重要的地位.而传统的共现词提取方法仅仅局限在单一的一种统计量上,其结果十分不精确,需要人工再进行整理.本文提出了一种基于

期刊

计算机应用中文信息处理共现词词汇吸引与排斥模型共现距离computer application Chinese information proces

全球经济复苏为时尚早但长期乐观

过去30年是全球化大发展的年代，形成了统一的世界市场。国际金融危机爆发以后，其影响通过贸易、投资和金融的传导机制迅速传递到了世界的各个角落，世界所有主要国家和地区都受到

期刊

全球经济复苏国际金融危机乐观时尚世界市场贸易逆差发展中国家传导机制

半结构化中文信息检索中查询结果相关度算法的研究

其他学术论文