论文部分内容阅读
从本质上看,信息检索应按照文档满足用户信息需求程度进行排序,因此当前以分类和排序策略为主流的研究方式存在与信息检索目标相关性较弱的缺点。本文尝试使用刚归分析策略,以文档满足用户的信息需求程度作为回归分析的目标值,利用回归支持向量机构建信息检索模型。该模型不仅提供了融合不同来源特征的灵活框架,而且由于使用回归支持向量机寻找具有ε不敏感损失的回归函数,因此具有良好的泛化性能。通过在TREC测试数据上的实验表明,本文模型性能优于目前主流的基于语言模型的信息检索方法。