结合加权特征向量空间模型和RBPNN的文本分类方法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:a595165933
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种结合加权特征向量空间模型和径向基概率神经网络(RBPNN)的文本分类方法.该方法针对传统的文本特征提取方法的不足,根据文本中特征项的位置信息和所属类别信息定义特征权重,然后,依据特征项的权值计算文档特征项的频数,通过TFIDF函数计算特征值并得到文本的特征向量,最后,采用RBPNN网络分类,通过最小二乘算法求解神经网络的第二隐层和输出层之间的权值,最终训练获得文本分类模型.文本分类实验结果表明,该方法在文本分类中表现出较好的效果,具有较好查全率和查准率.
其他文献
网络架构在全国演出场所监管系统中占据着如人体骨骼般的重要地位。从演出场所的监管设计需求出发,建立公网传输的网络体系架构,并结合监管系统的联网设计以及特定的监管传输
自20世纪90年代以来,本体逐渐被应用到很多领域,本体的构建方法论也成为国内外机构的热门研究课题。在分析和总结现有的本体构建经验的基础上,提出了一种领域本体的构建方法,
与非结构化P2P网络相比,结构化P2P网络具有良好的可扩展性、鲁棒性。但是结构化P2P覆盖网络是直接建立在逻辑网络之上,没有过多地考虑底层物理网络拓扑结构,导致逻辑拓扑结构
任务DAG图是刻画程序中各任务间依赖关系的一种手段,DAG图上除了标有任务间的依赖关系,还记录了各任务的计算量和任务之间的通信量,这些信息共同构成了任务调度的依据,国内外有许
Input子系统属于Linux系统下字符类驱动系统,现在Android、X-windows、Qt等众多应用于Linux系统中键盘、鼠标、触摸屏等输入设备的支持都通过、或越来越多倾向于标准的Input子
提出一种基于USB Token 和数字证书的分布式网络下的身份认证协议,它能够实现分布式网络环境下的单点登录功能,并且对重放攻击是安全的,保证了用户身份的真实性和用户票据的保密
在分析研究DHT算法与B+树模型的基础上提出一种新的网络模型——圆台网络,该圆台模型将DHT网络由二维带到三维,由平面转成了立体,通过把节点的路由表设成可动态增长的二维表,
DT网格是一种分析离散点的强有力的数学算法,因此,DT网格已经从最初用来分析地址学问题扩展到用来分析指纹匹配问题。在传统的DT网格匹配法的基础上做了一系列的改进,这种算法相对于传统的DT网格匹配法,在识别率上兵没有明显的突破,但是其利用了指纹不易改变的特新,在匹配速度上有了明显的进展。如果应用到大型的指纹数据库,这种算法的优越性就是显而易见的了。
通过分析用户浏览网站的访问日志,建立用户.网站的二部图。其次分别通过对用户和网站进行投影,构建出用户网和网站网。然后通过计算节点间的相似度来确定边的权值。最后计算了用
为解决辽河流域水环境综合监管系统数据交换平台的数据传输问题,设计并实现一个简单实用的数据传输器组件,简单描述组件的消息结构和消息传输的具体实现,重点介绍消息传输的