基于主成分分析的SMO文本分类

来源 :现代计算机:下半月版 | 被引量 : 0次 | 上传用户:asdf8865
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用SMO进行文本分类的核心问题是特征的选择问题,特征选择涉及到哪些特征和选择的特征维度问题。针对以上问题,介绍一种基于主成分分析和信息增益相结合的数据集样本降维的方法,并在此基础上对序贯最小优化算法进行改进,提出降维序贯最小优化(P-SOM)算法。P-SMO算法去掉了冗余维。实验结果证明,该方法提高SMO算法的性能,缩短支持向量机的训练时间,提高支持向量机的分类精度。
其他文献
<正> 多巴胺是治疗备种类型休克时常用的血管活性药物。但剂量不同,其药理作用亦不同。小剂量(每分钟3~5μg/kg体重)的多巴胺主要作用于多巴胺受体,使内脏血管扩张,肾血流量增
<正>随着现代计算机与数字技术的飞速发展,越来越多的科技元素渗透到了我们的日常生活中。技术改变命运,不再仅仅是一种姿态或者宣传,而将以不可阻挡的趋势,成为建构人类生命
<正>竹里作为乡村社区文化中心,通过"无限(∞)形"的拓扑找形有机地整合了展示、展览、会议以及餐饮、娱乐等多项功能。设计构思试图合理融入原有场地、周围村落以及自然生态
期刊
研究了不同浓度的重金属Cu2+、Cr6+、Pb2+胁迫对绿豆(Phaseolus radiatusL.)种子萌发和幼苗初期生长的影响。结果表明:低浓度抑或高浓度Cu2+、Pb2+胁迫对绿豆种子发芽率的抑
医药行业在我国发展的速度一直很快,社会医药流通企业的数量也日益增多,因此市场竞争十分激烈。现阶段医药行业在发展过程中出现诸多亟待解决的问题。基于此,本文就医药流通
马克思的自然观是建立在历史唯物主义基础之上的自然观。历史性原则、生存论原则是它的基本解释原则。作为哲学世界观的自然观不同于自然科学,人与自然的关系是哲学自然观的
在认真分析了现代医院各科室部门的用水种类和水质要求的基础上,归纳了生活饮用水的水质特点,进而介绍了医院常用工业用水处理方法、纯化水集中制备、分质供给流程模式,并总
为改善Cu基催化剂活性,在确定最佳Cu负载量的基础上,采用冷等离子体技术改性CuO/γ-Al2O3催化剂,利用SEM、BET、XRD和XPS技术表征催化剂,研究冷等离子体改性作用对催化剂催化
在传统酸奶技术的基础上,将脱脂奶粉与果珍混合后接入乳酸菌发酵.采用正交实验设计筛选出产品最佳配方工艺条件为:蔗糖量4%,蓝莓味果珍量2%,接种量3%,发酵时间6h,该果珍酸奶
课程实验是大学教学中非常重要的一环,教师需要全面地分析学生实验成绩从中发现规律才能科学地进行实验教学。运用数据挖掘中的关联规则技术建立大学课程实验效果分析模型,对