最优搜索理论与支持向量机在信息检索中的应用研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yzlwxl3554041
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的迅猛发展,网上的信息数量成指数级别增长,如何有效组织、检索、处理这些信息成为当前研究的重要课题。信息检索是指从海量文本信息中找到与给定信息需求想关的一定数量文档的过程。传统的信息检索,比较关注于检索结果的准确性等特性,对检索资源(如时间)的限制讨论的比较少。本文正是针对上述问题,提出了一种基于支持向量机的最优搜索模型,讨论了在资源受限制条件下的搜索策略。本文主要内容为:1.研究了分布式信息检索中的资源描述和资源选择方法。提出了一种新的基于支持向量机的最优搜索模型,同时考虑检索的资源限制和准确度问题。2.对文本分类的支持向量机与核函数方法进行了深入分析。以往的大多数研究,主要关注文本的向量空间模型表示法,对文本序列表示法的分类研究比较少。本文在字符串序列核函数与词序列核函数的基础上,提出了一种新的基于句子级别核函数,并给出两种可行算法,句集合核函数与旬序列核函数。3.研究了支持向量机软件包LIBSVM并加以改进。LIBSVM的CSharp2.6版,只支持基本的核函数计算:如线性核函数、多项式核函数、RBF核函数等,对于用户自定义的核函数还没有提供支持。而本文提出的核函数是基于句子级别的特定类型核函数,也会用到序列核函数的算法,所以必须要求软件包能够提供自定义核函数的功能。4.综合所有的研究成果,独立完成了一个文本分类及检索系统。
其他文献
随着汽车电子技术的飞速发展和智能化终端设备的普及,新一代车载信息娱乐系统的构建成为人们关注的焦点。而HTML5技术能帮助车载信息娱乐系统供应商,紧跟消费产品、应用程序和
结构健康监测技术将驱动元件或者传感元件集成在结构中,同时与材料结构的建模方法和信号信息的处理方法相结合,通过对特征参数的提取,在线实时地识别结构的健康状况,然后通过
本文论述了基于SNMP的IT设备管理系统的设计与实现。首先,提出了系统的体系结构和功能模型,包括5大功能模块:拓扑管理、告警管理、性能管理、安全管理和日志管理。其次,阐述
随着电信技术与计算机技术的发展,电信网络与计算机互联网络不断融合,网络提供的业务种类大量增加。同时越来越大的网络规模加上越来越复杂的网络结构,使信息技术的应用模式也发
随着计算机技术的发展,计算应用的模型也发生了重大改变。作为一种新的载体——嵌入式系统应运而生。嵌入式系统研究的一个热点和难点问题是嵌入式操作系统。为了满足专业领
随着网络技术和多媒体技术的迅速发展,大量的多媒体信息都可以从网上获得。如何从众多的多媒体信息中检索出我们需要的信息,是当前的一个热点问题。本文主要进行了多媒体信息
近年来的研究发现,许多现实系统都可以用一个复杂网络来描述。这些复杂网络具有一些相同的特征,如网络平均路径长度较小、聚类系数较大、节点度分度服从幂律分布等,这些特性是复
随着互联网与信息化技术的迅速发展,社会网络逐渐普及,越来越多的人们在网上共享数据并参与各种各样的活动。社会网络的出现无疑给人们的沟通与娱乐提供了及其广阔的平台,但
工作流系统成功的关键在于向其输入的工作流的质量。因此,工作流建模成为当今工作流研究的一个热点问题。 工作流管理联盟(Workflow Management Coalition,WfMC)将整个工
随着Internet的迅速发展,网络信息不断膨胀。为了提供高效、准确的信息服务,我们需要对网络中繁杂的信息进行合理的组织与分类。本文的目标就是以HTML文本信息处理为背景,从理论