中文文本分类中特征提取方法的比较与改进

来源 :兰州工业高等专科学校学报 | 被引量 : 0次 | 上传用户:yangtianmei01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前有多种特征提取方法用于文本自动分类,其中CHI方法效果较好,研究发现CHI方法存在着词与类别的无独立性假设及计算复杂度高等缺点,提出一种改进了的CHI方法ICHI(ImprovedCHI),通过分类实验仿真数据显示,在SVM与KNN分类中这种改进后的特征提取方法ICHI特征提取效果优于传统的CHI方法,改进后的方法ICHI能提高文本分类的准确率,适合局部特征提取.
其他文献
针对传统否定选择算法存在的问题,提出一种新的基于否定选择的检测器生成算法,通过使用模板来消除冗余的检测器,从而提高系统监测效率.实验表明,该算法能够尽可能多的覆盖“非我”
为了研究桥头跳车问题,对采用双向土工格栅加筋与短搭板相结合的方法在武汉阳逻长江大桥接线上进行了实体工程试验研究,对桥头加筋和没有加筋路堤的分层沉降和地基沉降,以及路堤
为了提高主动信息安全过滤的质量,将网络底层过滤技术和基于内容的安全过滤相结合,并以常规的两层过滤模型为基础,构建了一个多层次多策略的主动信息安全过滤模型,该模型可以
利用PoweBuilder可视化开发环境,基于MapX的GIS组件技术和Oracle数据库设计开发了小区物业管理信息系统,给出了系统主要功能以及部分图形功能的实现技术,介绍了系统的主要功能界面.