分布权值调节概率标准差的文本分类方法

来源 :计算机应用 | 被引量 : 1次 | 上传用户:tianyq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本分类问题,基于特征分布评估权值调节特征概率标准差设计了一种无须特征选择的高效的线性文本分类器。该算法的基本思路是使用特征概率标准差量化特征在文档类中的离散度,并作为特征的基础权重,同时以后验概率的Beta分布函数为基础,运用概率确定性密度函数,评估特征在类别中的分布信息得到特征分布权值,将其调节基础权重得到特征权重,实现了线性文本分类器。在20Newsgroup、复旦中文分类语料、Reuters-21578三个语料集进行了比较实验,实验结果表明,新算法分类性能相对传统算法优势显著,且稳定、高
其他文献
自然灾害对国民经济和人民生活能造成巨大的损失 ,因此 ,研究灾害对国民经济的影响具有重要的意义。灾害系统是一个十分复杂的系统 ,直接建立灾害对国民经济影响的定量分析模
如何充分利用多核异构系统的性能优势为实际应用服务正在成为新的研究热点。以图形算法为例,通过对光线投射体绘制算法的过程进行功能分解,并采用按行分块的静态分配策略,对光线投射体绘制算法研究实现了在CellB.E.多核异构系统上的并行算法设计和开发,并使用SIMD等方法进行了性能优化。性能评测显示其具有较好的加速比和可扩展性,优化后性能提升明显。
城市生活是丰富多彩,光怪陆离的。户外生活是其中非常重要的一个篇章,对于城市入来说,现代化的户外空间是流动的高效空间,对环境的感知和认识决定入的行为。因此,引导性高的空间对
针对基于单类支持向量机的网络故障异常检测存在的训练速度慢和检测精度低等问题,提出一种最小二乘模糊单类支持向量机(LSFOC-SVM)。该方法采用最小二乘损失函数和等式化约束改进标准单类支持向量机的训练算法,将二次规划转化为解线性方程组,降低了计算代价;并通过构造基于特征空间距离的模糊隶属度函数和优化选择告警阈值,适当扩大了故障预警范围,提高了故障检测率。与同类方法相比,该方法在保证检测效果的同时大
本文进行了震时有毒有害气体泄漏危险性分析模型的研究。简述了传统的评估方法,并指出了不足。通过有毒物质毒性分级、泄漏危险参数定义以及泄漏概率的计算分析,并配合易损性矩阵,确定最大可能泄漏点。
桥梁随着使用年数的增加,其性能逐渐退化.为了延长结构的使用寿命,最大限度发挥桥梁的剩余价值,需要对桥梁结构进行维修加固.桥梁加固维修决策主要以安全、经济分析为依据,给