文本分类技术及在辅助决策中的应用研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wain155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网技术的迅速发展与日益普及,电子文本信息越来越丰富,同时人们在这些海量的信息面前又感到无从下手。因此,有效的组织和管理这些信息,并快速准确的从中找到用户所需要的信息是当前信息技术领域面临的一大挑战。文本分类技术作为处理和组织大量文本数据的关键技术,可以有效的实现信息分流、解决信息杂乱问题,从而方便用户快速做出决策。本文主要对文本分类及其相关技术做了研究,并就如何将文本分类技术更好的用于辅助决策做了研究,具体包括以下四个方面:(1)文本分类特征权重计算方法的研究本文首先阐述了传统的权重计算方法应用在文本分类任务中的不足之处,并验证了采用特征选择评估函数对词频加权的权重计算方法的有效性。(2)基于反馈的类中心向量分类模型类中心向量分类算法是一种效率较高的分类算法,本文在其基础上,提出了改进的基于反馈的类中心向量分类算法。该算法的主要思想是利用错分的训练集样本不断的修正与其相关的类别的中心向量,使其更好的贴近训练集数据的真实分布,从而使其在测试集上的性能得到明显提升。实验证明该算法是有效的。(3)基于支持向量机的领域文本分类本文提出了基于支持向量机的领域文本分类模型,该模型讨论了文档的标题在文本分类中的作用。文档的标题一般处在这篇文档的最前边的位置,体现了文档的中心思想,因此本文提出用文档的标题来代替文本正文内容执行分类任务。实验证明,可以获得最大程度的分类精度与分类效率的折中。(4)文本分类技术在辅助决策中的应用研究本文实现了面向特定领域的文本多层分类系统。领域相关的信息是用户想要关心的,系统通过二元分类将原始的文本集合分为领域相关和领域无关,可以有效节省用户的决策时间;系统通过领域分类这一模块将领域相关的信息再分类,可以使用户快速的定位到想要关注的具体类别;针对某些特定问题,系统利用分类技术给予浅层的分析为人们的决策提供辅助作用。
其他文献
近年来,计算机技术和互联网技术的迅猛发展,有力地推动了社会进步。计算机网络已经渗透至社会各个领域,成为人们工作和生活中必备的工具之一。然而与此同时,计算机网络的安全
DVB(Digital Video Broadcasting,数字视频广播)是数字电视的标准。基于DVB标准的数字广播系统已在卫星、有线、地面等传输媒介中广泛部署。IP是互联网中的核心协议,IP over
我国是煤炭生产大国,但存在严重的煤矿安全生产问题(如矿井火灾、瓦斯爆炸等),造成大量的人员伤亡和财产损失。要保证煤矿工作人员的安全,需要对他们进行安全教育、救生训练
Ad Hoc网络是一个无需架设固定网络设施的多跳、自组无线网络。从初期的军事通信中的应用,Ad Hoc网络技术现在已经逐渐的被使用在商业通信中。随着多种网络业务的开展,在Ad H
北京市普通高中毕业会考作为以测量和评价高中学生学业水平、学校教学质量为主要目的大规模考试,属于标准参照性考试,它是衡量普通高中学生是否达到毕业标准的依据。随着数据
移动互联网革命性地改变了网络服务的理念,它降低了个人获得和共享信息的成本,动态位置信息被充分的利用促进了基于位置服务(LBS)的兴起。由于位置可以作为一个重要因素被定性和
随着网络技术的发展,网络教学逐渐成为一种重要的教学方式。北京工业大学在2002年引进教育在线网络教学平台。经过几年的建设,该平台已经具备了相当的规模,它与传统教育模式
作者简介:  李敏,女,穿青族,1989年9月生,贵州省毕节市大方县人,六盘水师范学院艺术系学生。研究方向:美术学国画。
期刊