基于聚类分析的图模型文档分类

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:hukuikui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统向量空间模型中的特征项孤立处理问题,首先通过χ2统计和特征聚类相结合的模式实现特征降维,然后使用图模型来建立词和词之间相互关联信息,最后运用KNN方法进行文档分类测试。该算法提高了稀有词对分类的贡献,强化了关联词的分类效果,并降低了文档向量的维数。实验证明,该算法提高了分类的准确率和召回率。
其他文献
威胁计算机安全的主要途径是通过操作系统或者应用程序的漏洞来获取对系统的非授权访问,进而达到恶意攻击的目的。针对这一问题,实现一种运行时安全隐患监测模块,该模块在动态信息流追踪技术的基础上,通过分析程序运行时内存和寄存器中的内容,动态地检测和记录程序的信息流,从而实现对恶意攻击的定位和预防。
随着社会的不断发展,人们对阅读认识的不断深化,越来越多的人们开始认识到阅读对人终身发展有着重要意义。阅读是人们获取消息,增长知识的主要方式。尤其是现代人阅读方式和阅读内容选择更加多样化。阅读能力成为衡量一个人知识储备、学习能力的重要表现。在我国当前的教育体制下,培养学生的阅读能力主要依赖于语文阅读教学。语文阅读教学是小学语文高年级教学的重要组成部分。小学高年级语文的阅读课堂不仅是对小学一至四年级学
随着我国纪检监察信访工作的进一步完善与扩大,纪检监察信访工作越来越复杂多变。纪检监察部门的信息管理任务越来越重。原本建立的纪检监察信访信息系统已经不能再适应现代
网络的高速发展势不可挡。虚拟生活的出现,以及与现实生活的互动,已成为当今人们生活的一种环境。作为一种文化、一种生活方式,因特网必然对现存社会的伦理精神作出挑战。人类社
目的:玉屏风散具有双向免疫调节作用,能提高低下的免疫力,抑制免疫亢进,对免疫失调性疾病疗效颇佳。方法:将223例过敏性鼻炎患者随机分为治疗组117例和对照组106例,对照组给
<正> 我们从拉萨市当雄、林周、达政县采集病羔粪样,经ELISA法检出的轮状病毒阳性粪样,回归初生羔羊腹泻成功;用人工复制病羔粪样提取物,接种羔羊肾细胞,产生CPE;任选人工复
阴离子Gemini表面活性剂具有优良的乳化性、发泡性、去污能力、耐盐性、分散性、易生物降解性,在日用化工、三次采油、金属防护、环境保护、新型材料等领域具有广泛的用途。