一种面向非平衡数据的邻居词特征选择方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:only_xin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在非平衡数据情况下,由于传统特征选择方法,如信息增益(Information Gain,IG)和相关系数(Correlation Coefficient,CC),或者不考虑负特征对分类的作用,或者不能显式地均衡正负特征比例,导致特征选择的结果下降.本文提出一种新的特征选择方法(Positive-Negative feature selection,PN),用于邻居词的选择,实现了文本中术语的自动抽取.本文提出的PN特征选择方法和CC特征选择方法相比,考虑了负特征;和IG特征选择方法相比,从特征t出现在正(
其他文献
高羊茅是主要的多年生冷季型草坪草,具有耐旱、耐瘠、抗病力强、适应性广等优良特性,在我国很多地方的城市绿化和运动场地的建设中应用广泛,是国内主要应用的草坪草之一。高
【摘要】大数据技术近几年飞快的发展起来,我国的大数据技术也在不断发展进步。在这种背景下培养适合社会需要的大数据人才越来与迫切。高职高专院校作为我国人才培养的重要场所,培养适合工作社会需要的大数据技术与应用专业人才是工作的重中之重。但是我国的大数据技术与应用专业是近些年发展起来的新兴行业,在课程建设和课程发展过程中仍存在许许多多的不足,这些不足是阻碍我国大数据技术和应用专业的重要因素。针对这些不足我
本研究针对温室蔬菜生产中由过量施用氮肥以及不合理的灌水措施导致的氮肥利用率低、氮素损失(NO3--N、N2O气体排放和NH3挥发)严重的资源浪费和环境负效应问题,重点研究硝化抑
我国台湾地区矿产资源丰富,尤以煤炭、石油、硫磺、贵重金属等资源最多。19世纪中后叶正处各西方资本主义大国向帝国主义过渡时期,对远东地区掌控权的争夺及对矿产资源的占有
采用Lagrange建模方法建立了欠驱动柔性自平衡机器人的数学模型,对柔性关节部分考虑了其弹性势能,仿真验证了模型的正确性,刚度越大,机器人上半身角度跟踪越快.采用线性二次型最优