基于词频分布信息的优化IG特征选择方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:k413287823
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本特征选择是文本分类的核心技术。针对信息增益模型的不足之处,以特征项的频数在文本中不同层面的分布为依据,分别从特征项基于文本的类内分布、基于词频的类内分布以及词频的类间分布等角度对IG模型逐步进行改进,提出了一种基于词频分布信息的优化IG特征选择方法。随后的文本分类实验验证了提出的优化IG模型的有效性。
其他文献
从微粒体甘油三酯转运蛋白(MTP)的活性与多态性、在脂代谢中作用、表达与调节等方面综述了MTP是一种重要的脂质转运蛋白。MTP的活性、基因表达状态是控制极低密度脂蛋白(VLDL)合
采用云母冰凉母粒与常规聚酯熔融共混纺丝制备十字形冰凉聚酯全拉伸丝(FDY),对其纺丝工艺进行了研究。结果表明:冰凉母粒添加量为4%-6%,纺丝温度为286-290℃,纺丝速度为4300-4600m/m
为了提高直缘成型高频焊管成型质量,研究并设计了一种关于轧辊孔型的计算方法,以保证带钢成型的均匀与稳定,同时减少成型过程中的残余变形.以Φ339.7 mm×(4.8~16)mm规格产
用贵州小香猪建立 2型糖尿病动物模型 ,探讨糖尿病小型猪三磷酸腺苷结合盒转运体A1表达的变化。采用高脂高蔗糖饲料喂养贵州小香猪 ,建立 2型糖尿病动物模型。血浆总胆固醇、
由于社会一直在进步,此时节能型的建筑开始受到人们的推崇,笔者结合自身的工作,讲述了当前建设节能相关的技术规定,而且分析了节能建设技术的方法。
采取物理气相沉积(PVD)对烧结Nd Fe B磁体表面进行镀Al处理,分析了PVD Al镀层的耐高温特性。样品经200℃×5h处理后,Al镀层抗盐雾(5%Na Cl,连续喷雾)腐蚀性能由原来的48h下降
分析了常导磁悬浮列车转向架刚度与车辆轨道跟踪能力的关系,给出了考虑车辆轨道跟踪性能的转向架刚度设计准则、悬浮电磁铁极面形状和转向架刚度匹配的方法,导出了按刚度设计磁
依据水稻强、弱势粒胚乳细胞增殖速率的差异,6个供试品种(含杂交稻组合、新株型品系)可分为3种类型:快速同步增殖型、异步增殖型和缓慢同步增殖型。发育胚乳中玉米素(Z)+玉米素
SWOT分析法是分析大学生创业内外部条件的有效手段,具体包含优势分析、劣势分析、机遇分析和威胁分析。本文运用SWOT分析法,为大学生提供四种客观的SWOT战略创业决策,为大学
我国幅员辽阔,不同地域肉羊饲养方式差异很大。如在牧区以散养放牧为主,并实施嗣栏化和分区轮牧;半农半牧区采用放牧加舍饲相结合的饲养模式.在农区以舍饲为主建立规模化育肥基地
会议