一种改进的文本特征选择方法的研究与设计

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户:niuniu31
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是文本挖掘技术的一个重要的环节。在中文分词的基础上,通过设计一个简单的应用程序,对文本进行预处理。然后,在分析比较几种用于文本分类的特征选择方法的基础上,提出了一种基于信息增益和互信息相结合的特征选择方法。利用它对文本文档进行特征选择,抽取代表其特征的元数据或特征词条构成特征向量,降低噪音。最后通过实验来和其它几种特征选择方法作比较,分析这种方法获取文本特征的精度。
其他文献
数学分析与概率论是互相渗透与相互依存的关系,两者共同发展,互相影响。数学分析作为一门基础性的学科,经过多年的发展与研究已经形成了一套较为完备的理论体系,并且对概率论
在2020年如期解决区域性整体贫困、完成当前脱贫目标后,脱贫工作进入后脱贫时代的新时期,在这一新阶段任务重心需要调整到保证脱贫不返贫、巩固脱贫攻坚成果上来。为更好适应
以手机为代表的通信市场近年匕速发展,器种新技术层出不穷,这就要求手机维修号业人才的培养理念要进行变革,改革传统的教学模式,本着“以能力为本位,以职业实践为主线,以生产要求为
提出了一种基于SCORM内容聚合模型的网络课程系统,该系统在深入分析了基于SCORM标准的网络课程资源包的内部组织结构,并以Blackboard平台导出的课程资源包为例,利用XML技术读
共享单车公益诉讼首案宣判:小鸣单车须10日内提存未退还押金!近日,广东省广州市中级人民法院公开开庭审理了广东省消费者委员会诉广州悦骑信息科技有限公司(小鸣单车运营主体)民事
报纸
无线传感器网络在部署初始阶段,由于未被恶意者察觉,或者破解存在难度,节点通常能够在一定时间内具有抵抗劫持的能力.基于此分析提出一种适合于静态网络的基于一次性预共享密钥的