【摘 要】
:
文本自动分类是当前智能信息处理中一类重要的研究课题.本文分析了基于统计理论的文本分类的基本特点,提出采用可变精度粗糙集模型中的分类质量构造新的特征词权重计算公式.
论文部分内容阅读
文本自动分类是当前智能信息处理中一类重要的研究课题.本文分析了基于统计理论的文本分类的基本特点,提出采用可变精度粗糙集模型中的分类质量构造新的特征词权重计算公式.这种新的加权方法,相对于广泛使用的逆文本频率加权方法,大大改进了文本样本在整个空间中的分布,使得类内距离减少,类间距离增大,在理论上将提高样本的可分性.最后利用支持向量机和K近邻两种分类器,验证了这种新的加权方法对分类效果确实有所提高.
其他文献
依据社会网络分析方法和人际竞争情报研究主题,本文从人际竞争情报建模对象、人际竞争情报网络模型描述、人际竞争情报网络静态研究、人际竞争情报网络动态研究四个方面论述
利用框架语义学原理,参考美国加州大学伯克利分校的FrameNet工程,我们构建了法律框架网络本体,针对当前网络信息检索存在的查准率低等问题,探讨中文法律框架网络本体应用之下
目的:探讨不同垂直骨面型骨性Ⅰ类错畸形患者颞下颌关节位置与形态的差异。方法:筛选骨性Ⅰ类错畸形成人患者108例,分为低角组(37例)、均角组(39例)、高角组(32例)。对各组患
每年4月份,很多人都会不约而同地来到位于山东省枣庄市的台儿庄,以各种形式纪念1938年那场著名的“台儿庄大捷”。久而久之,台儿庄也就成为联结海内外中华儿女历史情思的重要平
介绍了65 nm/45 nm工艺的研究成果、157 nm F2 stepper技术、高k绝缘层和低k绝缘层等技术.着重讨论了157 nm F2stepper的F2激光器、透镜材料、光刻胶和掩模材料问题.
自我国的社会主义市场经济体制建立以来,我国企业的发展和变革逐步深入,在各个方面都有了很大的突破和改变。并且随着市场需求的增多和多元化,以及互联网等一系列高新技术对