一种基于Bernoulli混合模型的不完整数据文本分类方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:suuuper4w
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在Bernoulli混合模型和期望最大化(EM)算法的基础上给出了一种基于不完整数据的改进方法。首先在已标记数据的基础上通过Bernoulli混合模型和朴素贝叶斯算法得到似然函数参数估计初始值,然后利用含有权值的EM算法对分类器的先验概率模型进行参数估计,得到最终的分类器。 实验结果表明,该方法在准确率和查全率方面要优子朴素贝叶斯文本分类。
其他文献
近年来,保税货物转卖业务发展非常迅速,而如何对转卖业务进行有效监管.目前的外汇管理政策并没有统一的制度规范,特别是对货权经过多次流转的转卖业务.由于对代表货权的凭证缺乏有
<正>设计师解析"橘中秘"是我打造的"时尚中国风"系列作品之一。本案着力思考的焦点为中式风格当如何创新,如何区别于一贯的常用设计技法。在我的探寻中,我觉得现代的中式当具
本文从众多的《毛泽东选集》版本中,选取汉文版和国外出版的外文版两个角度,对其出版情况进行了整体介绍,并撷取其中影响较大的版本,对选集中的“之最”进行研究和介绍。 In
目的:探讨艾司西酞普兰和度洛西汀对抑郁症患者述情障碍的疗效。方法:对艾司西酞普兰组29例患者和度洛西汀组24例患者分别在基线、服药2周及8周进行TAS-20及HAMD-17测试。结果:
随着基准利率地位的不断变化,上海银行间同行业拆放利率(SHIBOR)市场风险管理对金融机构将会越来越重要。然而同正态分布相比而言,SHIBOR收益率变量具有偏态等特征。提出采用广
在分析少数民族大学生面临的文化冲击和文化适应问题的基础上,旨在引导学生正确认识和科学对待不同的民族、文化和道德教育范式;树立正确的民族观、宗教观、文化观和价值观,以缓
去年12月7日,北京降了入冬以来最大的一场雪。当北京人正为这突如其来的雪惊喜的时候,却发现,雪变成了灾——降雪使北京环城路的交通几近瘫痪。下班的市民撂在路上、汽车上五
采用1995~2010年贵州省玉屏侗族自治县城镇化水平、第三产业增加值、招商引资数量、人均教育支出、R&D经费投入共五项的时间序列数据,运用普通最小二乘法的实证研究方法,对玉屏
目的:建立以高效液相色谱-蒸发光散射(HPLC-ELSD)检测法测定小儿氨酚黄那敏颗粒中胆酸和猪去氧胆酸含量的方法。方法:采用高效液相色谱法,色谱柱为Capcell Pak MGⅡC18色谱柱
《珠江三角洲地区改革发展规划纲要(2008—2020年)》提出将广州建设为国家中心城市,这是广州开创城市发展新局面的重大机遇。本文首先从理论层面对国家中心城市的概念和内涵进行