基于回归支持向量机的信息检索

来源 :第五届全国信息检索学术会议CCIR2009 | 被引量 : 0次 | 上传用户：lichao0714900

【摘要】

：

从本质上看，信息检索应按照文档满足用户信息需求程度进行排序，因此当前以分类和排序策略为主流的研究方式存在与信息检索目标相关性较弱的缺点。本文尝试使用刚归分析策略，以文

【作者】

：

韩咏[1]齐浩亮[1]杨沐昀[2]李生[2]

【机构】

：

黑龙江工程学院,哈尔滨,150050

【出处】

：

第五届全国信息检索学术会议CCIR2009

【发表日期】

：

2009年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

从本质上看，信息检索应按照文档满足用户信息需求程度进行排序，因此当前以分类和排序策略为主流的研究方式存在与信息检索目标相关性较弱的缺点。本文尝试使用刚归分析策略，以文档满足用户的信息需求程度作为回归分析的目标值，利用回归支持向量机构建信息检索模型。该模型不仅提供了融合不同来源特征的灵活框架，而且由于使用回归支持向量机寻找具有ε不敏感损失的回归函数，因此具有良好的泛化性能。通过在TREC测试数据上的实验表明，本文模型性能优于目前主流的基于语言模型的信息检索方法。

其他文献

基于配对约束的核半监督非线性降维算法

降维是在损失较少信息的情况下处理高维图像数据的关键技术，是高维数据预处理的重要步骤。本文研究了基于配对约束和混合核函数的半监督非线性降维方法KS2DR,该方法可有效利用

会议

中文搜索引擎日志中查询分析的研究

搜索引擎日志是记录网络搜索引擎用户行为的重要载体，通过对搜索引擎日志的分析可以得到搜索用户的行为特点和规律。为了发现用户组织查询的规律，本文对Sogou中文搜索引擎一个

会议

基于分层的以目标结点为导向的XML枝匹配算法

目前，已提出的XML枝匹配算法返回的结果都是整个匹配枝，另外，当XML文档中存在递归结构时，一个目标数据元素可能存在于多个匹配的枝中。然而，通常情况下，用户只需要得到目标数据元素

会议

相关反馈任务中一种基于文档相似度的检索结果重排序方法

研究界关于相关反馈问题的研究已经有近30年的历史，相关反馈也被证明可以在很大程度上稳定地提升检索系统的性能。由于目前相关反馈的应用，以及用户提供反馈信息的方式都发生了

会议

基于线性模型的查询扩展方法

查询反馈是通过分析反馈文档来更改原始查询项。检索词在检索公式中的权重直接影响检索结果的质量，但是缺乏可靠的依据来设置检索词权重。本文将检索看作是一个二分类问题，在线

会议

科技主题识别及表示

科技主题用来表征学科的研究关注点，是科技热点的具体承载对象。当前，科技主题获取的自动化程度不高，绝人多数都借鉴专家经验实现。结合自然语言处理领域TDT的研究成果，针对科技

会议

科技热点主题发现表示方法自然语言处理专家经验研究成果文献特征链接分析聚类方法自动化框架式关注点证明学科文本实验对象表征

美国:经济韧性和策略效率支撑的投资信心

2007年5月以来一个月时间里,美元汇率始终盘整在对欧元汇率1.34美元和对日元120日元以上水平,美元稳定性较为突出,同时美国经济表现出利好增多的倾向。虽然国际金融市场价格

期刊

金融市场价格美元利率经济表现美元汇率利率调整欧元汇率利差交易美联储通货膨胀利好

Kad网络节点共享资源探测分析

Kad网络中存在数百万的共享资源，而其中有相当一部分可被评定为敏感资源。首先用我们的Kad网络采集器：Rainbow对节点拥有的文件资源进行探测;然后对节点资源和敏感资源进行相关

会议

网络节点共享资源文件名网络采集器统计分析随机样本节点资源流行度共现词探测评定判别长度

基于LDA新闻话题的演化

新闻话题及其它的演化研究可以帮助人们快速了解和获取新闻内容。本文提出了一种挖掘新闻话题随时间变化的方法，通过话题抽取、话题过滤和话题关联实现话题的演化。首先应用LD

会议

新闻内容不同时间段演化研究随时间变化自动抽取演化过程演化关系过滤关联贡献度多对多证明文集文档挖掘实验可变计算

基于滑动窗口提取和IDF过滤方法的专家搜索系统研究

对于一个大型企业组织来说，能够自动地找出组织内部某一领域内的专家是十分有用的。解决专家检索系统的诸多方案中，一个有效的方法就是先对每个专家提取其相关信息，从而建立一个

会议

基于回归支持向量机的信息检索

与本文相关的学术论文