基于机器学习的维吾尔文文本分类研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:liond1803
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型(VSM)表示下的高维性,采用词干提取和IG相结合的方法对表示空间进行降维。采用基于机器学习的分类算法(kNN和Nave Bayes)对维吾尔文文本语料进行了分类实验并分析了实验结果。
其他文献
吉林师范大学化学学院创建于1959年,经过近半个世纪的努力,现已初步建设成了学科建设突出,人才培养质量高、特色鲜明的学院。学院设有化学教育(师范)、应用化学(非师范)两个本科专业
为了保证数据库系统在不同的负载情况下,始终提供强大的事务处理能力,必须对数据库系统进行性能优化。依赖于DBA,来分析性能数据,然后进行系统优化,在系统越来越复杂、负载持续波
<正> 税费是当前林业经济领域的热点问题,集体林区林业税费负担重已成了共识。然而事实究竟是怎么一回事?林业的超负荷来自哪些方面?这一问题的症结在哪里?如何解决?本文拟就
本文以德州市宁津县为例,研究提出了如何发挥地区优势,因地制宜,创新性地推进精准扶贫工作,以期全面实现脱贫致富。
图像DCT变换由于计算量大,软件实现往往难以满足实时处理的要求,基于FPGA在硬件上实现了图像的DCT变换。设计采用了2D-DCT的行列分解结构,在两级1D-DCT之间引入双RAM结构,通过乒乓操作保证了前后级DCT运算的并行性,提高了运算速度。整个模块使用Verilog HDL建模,通过ModelSim编写激励对逻辑功能进行了验证,最后在Quartus Ⅱ上通过了综合编译,设计优化后下载到Alt
This paper proposes a virtual router cluster system based on the separation of the control plane and the data plane from multiple perspectives,such as architect
时变背包问题(TVKP)是一种典型的动态组合优化问题,由于其中某些量的动态变化,导致此问题非常难以求解。基于双重结构编码微粒群算法(DPSO)与贪心修正策略(GCOS)相结合,给出了一种
用直流弧光放电的方法已经合成了C-BN的纳米晶体.并用XRD,TEM方法鉴定了其生长粉末的特性.其结果已经表明在粉末中,从20~60nm,c-BN和h-BN颗粒可以共存,升华-再杂化-结晶的反应途径已
研究了利用不同浓度的PEG浸泡老化种子,对其进行电导率和种子活力的测定,结果表明,不同浓度PEG对老化种子有一定修复作用,提高了种子活力,但适宜浓度因种子种类不同而异.PEG
本文引入了P-投射模,n-p-投射模,Gp-投射模概念.由此构造了两种特殊的环:n-p-半单环与Gp-半单环,并用新引入的模对它们分别进行了刻化.