基于机器学习的维吾尔文文本分类研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：liond1803

【摘要】

：

随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型

【作者】

：

阿力木江·艾沙吐尔根·依布拉音艾山&

【机构】

：

新疆大学现代教育技术中心,新疆大学信息科学与工程学院

【出处】

：

计算机工程与应用

【发表日期】

：

2012年5期

【关键词】

：

文本分类朴素贝叶斯方法 k-最近邻方法(kNN) 维吾尔语特征选择 text categorization Nave Bayes k-Nearest

【基金项目】

：

国家自然科学基金（No.61063026 60963018）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型（VSM）表示下的高维性,采用词干提取和IG相结合的方法对表示空间进行降维。采用基于机器学习的分类算法（kNN和Nave Bayes）对维吾尔文文本语料进行了分类实验并分析了实验结果。

其他文献

吉林师范大学化学学院

吉林师范大学化学学院创建于1959年，经过近半个世纪的努力，现已初步建设成了学科建设突出，人才培养质量高、特色鲜明的学院。学院设有化学教育（师范）、应用化学（非师范）两个本科专业

期刊

化学学院师范大学吉林人才培养质量物理化学学科建设化学教育本科专业

基于轻量数据挖掘方法的数据库锁表优化

为了保证数据库系统在不同的负载情况下，始终提供强大的事务处理能力，必须对数据库系统进行性能优化。依赖于DBA，来分析性能数据，然后进行系统优化，在系统越来越复杂、负载持续波

期刊

数据库自我优化锁表规则引擎神经网络预测器数据挖掘database self-optimization lock table rule engin

南方集体林区林业税费问题探讨

<正> 税费是当前林业经济领域的热点问题,集体林区林业税费负担重已成了共识。然而事实究竟是怎么一回事?林业的超负荷来自哪些方面?这一问题的症结在哪里?如何解决?本文拟就

期刊

林业税费税收

德州市宁津县发挥优势创新推进精准扶贫工作的探索研究

本文以德州市宁津县为例,研究提出了如何发挥地区优势,因地制宜,创新性地推进精准扶贫工作,以期全面实现脱贫致富。

期刊

精准脱贫产业扶贫市场前景规范引导

数字图像DCT变换的FPGA实现

图像DCT变换由于计算量大,软件实现往往难以满足实时处理的要求,基于FPGA在硬件上实现了图像的DCT变换。设计采用了2D-DCT的行列分解结构,在两级1D-DCT之间引入双RAM结构,通过乒乓操作保证了前后级DCT运算的并行性,提高了运算速度。整个模块使用Verilog HDL建模,通过ModelSim编写激励对逻辑功能进行了验证,最后在Quartus Ⅱ上通过了综合编译,设计优化后下载到Alt

期刊

二维离散余弦变换(DCT)现场可编程门阵列(FPGA)硬件结构乒乓操作two Dimension Discrete Cosine Transform （

A Virtual Router Cluster System Based on the Separation of the Control Plane and the Data Plane

This paper proposes a virtual router cluster system based on the separation of the control plane and the data plane from multiple perspectives,such as architect

期刊

摘要编辑部编辑工作读者Router Virtual Cluster the Separation of the Control Plane and

利用双重结构编码PSO求解动态背包问题

时变背包问题（TVKP）是一种典型的动态组合优化问题,由于其中某些量的动态变化,导致此问题非常难以求解。基于双重结构编码微粒群算法（DPSO）与贪心修正策略（GCOS）相结合,给出了一种

期刊

二进制微粒群算法双重结构编码时变背包问题贪心修正策略binary particle swarm optimization double-structu

直流电弧法合成立方氮化硼纳米晶体

用直流弧光放电的方法已经合成了C-BN的纳米晶体．并用XRD，TEM方法鉴定了其生长粉末的特性．其结果已经表明在粉末中，从20～60nm，c-BN和h-BN颗粒可以共存，升华-再杂化-结晶的反应途径已

期刊

直流电弧纳米晶体XRDTEMdirect current arc - discharge nanocrystallite XRD TEM

PEG渗透处理对老化种子活力的影响

研究了利用不同浓度的PEG浸泡老化种子,对其进行电导率和种子活力的测定,结果表明,不同浓度PEG对老化种子有一定修复作用,提高了种子活力,但适宜浓度因种子种类不同而异.PEG