基于DF和CHI的联合特征提取方法及其应用

来源 :北京工业大学学报 | 被引量 : 0次 | 上传用户:xiawa371236585
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了与类别信息有关的CHI统计特征选取方法和与类别无关的文档频率特征选取方法,在此基础上提出文档频率与CHI统计相结合的特征提取方法,以选取分类能力强的词项特征,从而提高网页分类效果.以该联合特征提取方法为基础构建的网页分类系统,在参加SEWM2007分类评测的8个代表队中,取得Macro-F1值排名第3的成绩.
其他文献
目的:数据挖掘技术在医学中的应用日益广泛,但也面临诸多问题,其中数据冗余及类不平衡分类问题是数据挖掘领域承待解决的问题。本研究基于健康体检大数据,以代谢综合征智能甄
针对嵌入式系统设计复杂性的不断增加以及设计周期逐渐缩短的问题,提出一种系统级设计方法.在系统的软/硬件实现之前建立系统的抽象模型,对系统定性和定量属性进行评估,确定设计方
提出了一种毛巾瑕疵特征提取的方法-模糊小波分析算法,同时给出了有实用价值的特征提取,瑕点识别的系统结构,利用小波基函数从信号中提取毛巾图像中各种瑕疵特征,然后利用模糊推理
研究了一种大功率单管LD(激光二极管)泵浦晶体、Ⅰ类临界相位匹配LBO腔内倍频、高效紧凑结构的全固态红光激光器.利用自行设计的高耦合效率、小聚焦光斑的自聚焦透镜耦合LD,当泵
信息化技术水平的不断提高深入影响了各行各业的发展。针对企业内部控制管理的应用也是信息化应用的一个方面。本文主要对信息化环境下的企业内控审计工作问题进行分析,总结
介绍了用ActiveX数据对象(ADO)在构建Labview中数据库访问接口方面的应用.通过比较几种LabView中的数据库访问接口的优缺点,详细说明了用ADO构建数据库访问接口的方法,并用此