基于回归支持向量机的信息检索

来源 :第五届全国信息检索学术会议CCIR2009 | 被引量 : 0次 | 上传用户:lichao0714900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从本质上看,信息检索应按照文档满足用户信息需求程度进行排序,因此当前以分类和排序策略为主流的研究方式存在与信息检索目标相关性较弱的缺点。本文尝试使用刚归分析策略,以文档满足用户的信息需求程度作为回归分析的目标值,利用回归支持向量机构建信息检索模型。该模型不仅提供了融合不同来源特征的灵活框架,而且由于使用回归支持向量机寻找具有ε不敏感损失的回归函数,因此具有良好的泛化性能。通过在TREC测试数据上的实验表明,本文模型性能优于目前主流的基于语言模型的信息检索方法。
其他文献
降维是在损失较少信息的情况下处理高维图像数据的关键技术,是高维数据预处理的重要步骤。本文研究了基于配对约束和混合核函数的半监督非线性降维方法KS2DR,该方法可有效利用
会议
搜索引擎日志是记录网络搜索引擎用户行为的重要载体,通过对搜索引擎日志的分析可以得到搜索用户的行为特点和规律。为了发现用户组织查询的规律,本文对Sogou中文搜索引擎一个
会议
目前,已提出的XML枝匹配算法返回的结果都是整个匹配枝,另外,当XML文档中存在递归结构时,一个目标数据元素可能存在于多个匹配的枝中。然而,通常情况下,用户只需要得到目标数据元素
会议
研究界关于相关反馈问题的研究已经有近30年的历史,相关反馈也被证明可以在很大程度上稳定地提升检索系统的性能。由于目前相关反馈的应用,以及用户提供反馈信息的方式都发生了
查询反馈是通过分析反馈文档来更改原始查询项。检索词在检索公式中的权重直接影响检索结果的质量,但是缺乏可靠的依据来设置检索词权重。本文将检索看作是一个二分类问题,在线
会议
科技主题用来表征学科的研究关注点,是科技热点的具体承载对象。当前,科技主题获取的自动化程度不高,绝人多数都借鉴专家经验实现。结合自然语言处理领域TDT的研究成果,针对科技
2007年5月以来一个月时间里,美元汇率始终盘整在对欧元汇率1.34美元和对日元120日元以上水平,美元稳定性较为突出,同时美国经济表现出利好增多的倾向。虽然国际金融市场价格
Kad网络中存在数百万的共享资源,而其中有相当一部分可被评定为敏感资源。首先用我们的Kad网络采集器:Rainbow对节点拥有的文件资源进行探测;然后对节点资源和敏感资源进行相关
新闻话题及其它的演化研究可以帮助人们快速了解和获取新闻内容。本文提出了一种挖掘新闻话题随时间变化的方法,通过话题抽取、话题过滤和话题关联实现话题的演化。首先应用LD
对于一个大型企业组织来说,能够自动地找出组织内部某一领域内的专家是十分有用的。解决专家检索系统的诸多方案中,一个有效的方法就是先对每个专家提取其相关信息,从而建立一个
会议