藏文文本分类技术研究综述

来源 :电脑知识与技术:学术版 | 被引量 : 0次 | 上传用户:hqchunyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文介绍了藏文文本分类技术的研究与进展。首先对现阶段常用的文本表示以及文本特征选择方法进行了分析和比较,接着回顾了藏文在机器学习方面的分类算法特点,深入讨论了不同算法应用在藏文文本分类技术上的研究情况,最后指出了当前藏文文本分类所面临的问题和挑战,并对未来的研究提出了建议。
其他文献
以芦苇为研究对象进行野外种植实验,设计4个水深梯度,通过挖低补高形成4个面积分别为10 m×20 m的岛状实验样地,样地之间形成一空水位梯度,枯水期岛面分别高出水面80 cm(
近些年,计算机视觉发展迅速,在水果识别方向进行了广泛的应用和研究。本文设计基于BP神经网络的水果识别系统,选取生活中常见的三种水果:苹果、橘子、香蕉作为对象。首先,通过网络资源等搜集水果图像建立样本库;然后通过MATLAB对图像进行预处理,为后续的特征提取做好准备。水果特征的提取选择纹理、形状、颜色三种特征进行提取;同时在每种特征中选用不同的特征值作为特征向量。通过提取三种特征后输入到BP神经网络
运用PHOENICS软件模拟分析夏季和冬季青岛市城阳区人民医院室外风环境,研究绿化布局和绿化模式对医院室外风环境的影响。结论如下:全院性防护林带和外部建筑对医院内部活动区
目的胆脂瘤型中耳炎患者应用完璧式乳突根治术治疗的效果分析。方法选取68例沂南县人民医院收治的胆脂瘤型中耳炎患者,所有病例均选自2018年3月~2019年12月,按照随机数字表法
生物胺是一类具有生物活性、低分子量的有机化合物,广泛存在于氨基酸丰富的食品中,尤其是水产品。但是过量摄入生物胺会对人体产生不良反应,因此生物胺是水产品安全性的重要
建立高效准确快速的通用型氨基酸分析方法是食品、农业、医学等科研工作中重要的研究方向。本文基于液相色谱串联三重四极杆质谱方法,建立了测定氨基酸含量的分析方法,并将该
摘要:训练语料库的贫乏对低资源语种的命名实体识别效果有很大影响,高资源语种向低资源语种进行标签投影解决了低资源语种的语料问题。但由于词典的投影昂贵且单一,而Wikidata提供多语词条,一对多的标注投影极大地减少了投影产生的噪声,通过易获得的双语平行文本,基于Wikidata词条可构建多语种知识库,完成标签投影,构建训练语料库,提升低资源语种实体的识别功能。  关键词:低资源语种;知识库;命名实体
摘要:高职学生的学习应更加强调实践动手能力的运用,因此在开展PHP商务网站开发课程的教学过程中,逐步指导学生使用PHP语言完成一个功能相对完善的在线考试系统,并最终从学生所制作的作品中,挑选出一个作品对班级学生完成最终的在线课程成绩考核,形成立竿见影的效果,从而提高学生的学习积极性和参与度。  关键词:在线考试系统;PHP语言;MySQL数据库;学习积极性  中图分类号:G642 文献标识码
为开发有机营养液,降低育苗成本,实现农业废弃物的循环利用,确定适宜植物生长的有机营养液浓度至关重要。本试验将腐熟香菇渣与鸡粪按体积比3∶1混匀做浸提原液,再将浸提原液