【摘 要】
:
随着蒙古语信息技术的发展和蒙语文编码国际标准的公布,蒙古语电子文本数量日益增多,依靠人工处理这些海量文本费时费力。针对这种情形,本研究创建了基于贝叶斯、支持向量机和神经网络等有监督学习方法的文本分类系统,并对这些算法的分类性能进行了比较。本文由绪论、正文及总结等部分组成。绪论部分介绍了选题依据及研究意义、研究概况、研究数据与研究步骤等内容。第一章说明了去噪、词元化、去除停用词和特征选择等相关的文本
论文部分内容阅读
随着蒙古语信息技术的发展和蒙语文编码国际标准的公布,蒙古语电子文本数量日益增多,依靠人工处理这些海量文本费时费力。针对这种情形,本研究创建了基于贝叶斯、支持向量机和神经网络等有监督学习方法的文本分类系统,并对这些算法的分类性能进行了比较。本文由绪论、正文及总结等部分组成。绪论部分介绍了选题依据及研究意义、研究概况、研究数据与研究步骤等内容。第一章说明了去噪、词元化、去除停用词和特征选择等相关的文本预处理方面的工作。第二章论述了关于贝叶斯算法的原理和本研究中实施的基于贝叶斯算法的蒙古语文本自动分类实验。第三章论述了支持向量机算法的原理和本研究中实施的基于支持向量机算法的蒙古语文本自动分类实验。第四章论述了神经网络算法的原理及本研究所运用的网络模型结构,并介绍了本研究中实施的基于神经网络算法的蒙古语文本自动分类实验。结论部分总结了全部研究过程及三个有监督机器学习方法的运行结果,并提出了今后需要改进的工作。
其他文献
水稻能够积累比其它谷物主食高10倍以上的As浓度,这是淹水条件下水稻土As有效性增加以及As通过Si转运通道,进入水稻体内的综合结果。因此,从去除土壤As的角度出发,水稻是一种
大豆(Glycine max)原产于我国,是世界范围内主要油料作物之一。由于大豆转基因效率较低,病毒介导的基因沉默(VIGS)技术已成为在大豆上研究基因功能的关键技术之一。大豆花叶病毒(Soybean mosaic viruss,SMV)病是一种全球性大豆病毒病害,广泛分布于我国各大豆主产区,严重影响大豆的产量与品质。SMV常引发大豆叶片表现花叶和坏死两种症状。通过蛋白组学研究,发现抗坏血酸过氧化
目的:人巨细胞病毒(Human cytomegalovirus,HCMV)属β疱疹病毒亚科,为线性双链DNA病毒。HCMV感染早期主要表达两种蛋白,即IE72(ie1基因编码)和IE86(ie2基因编码),其中IE86在
目的:将兔骨髓间充质干细胞,成骨细胞以及人脐静脉内皮细胞共培养体外构建三维微组织,并植入裸鼠皮下观察其异位成骨的能力。方法:1.兔骨髓间充质干细胞(Bone marrow derived
回鹘式蒙古文文献是中古蒙古语的重要文献。近年来陆续发现了一些回鹘式蒙古文文献。本文所研究的《普度明太祖长卷》回鹘式蒙古文也是一部新发现的14世纪回鹘式蒙古文重要文献,并且该文献较完整地保留了中古蒙古语语音、语法、词汇方面语言特点。因此,该文献的深入研究对中古蒙古语研究具有重要的学术价值。针对《普度明太祖长卷》回鹘式蒙古文的研究,除了哈斯额尔敦教授的首次公布和研究的论著外,尚未出现更多的研究。因而,
目的慢性心力衰竭(Chronic Heart Failure,CHF)是在各种心脏疾病基础上,以心脏充盈或射血功能降低为主要表现,是大多数心血管疾病的终末阶段。近二十多年来老年心力衰竭的发
本文根据蒙古语自然语言信息处理要求出发,对蒙古语《MQRI(马)》一词构成的复合词进行了语义研究。全文以导论、第一章、第二章、总结等四个部分组成。导论部分主要简述了由《MQRI(马)》一词构成的复合词的选题依据、研究概况、研究方法、材料来源及研究目的等。第一章,主要分析了由《MQRI(马)》一词构成的复合名词的语义结构。首先运用语义场理论对复合名词进行了语义分类。其次,分别运用认知语言学理论与述谓
目的:观察银翘三豆散治疗疱疹性咽峡炎风热乘脾证的临床疗效,总结其疗效优势,初步评价其疗效和安全性,为临证治疗本病提供新的思路和方法。方法:本课题采用随机、阳性药对照
目的:探讨Blackburne-Peel指数(blackburne-peel ratio,BPR)和改良Insall-Salvati指数modified insall-salvati ratio,mISR)与全膝关节置换术(total knee arthroplasty,TKA)
目的:多形性胶质母细胞瘤(glioblastoma multiforme,GBM)是目前最常见的中枢神经系统原发性肿瘤,可发生于任何年龄,约占所有颅内肿瘤的15%,具有恶性程度高、侵袭性强的特性。同时,GBM具有高度异质性,预后极差,临床上针对特定分子靶标或亚型进行精准诊疗尤为重要。转化生长因子-β(transforming growth factor-βTGF-β)信号途径通过其肿瘤抑制或促进机