藏文文本相关论文
藏语文本规范化是指通过对藏文文本上下文分析,把其中的数字、简写符号或者特殊语义块识别出来,给出它们在规范化藏文词表的规范写......
本文在介绍信息增益、互信息、χ2(CHI)统计量和期望交叉墒四种常用的藏文文本分类提取特征词的基础上,研究了基于词性特征提取......
本文叙述了25年来中国藏语信息处理领域有关藏语文本及电子词典工作的发展过程以及目前的进展状况.叙述的内容有藏语文本统计计算......
复杂文本布局引擎是操作系统与大型应用软件不可缺少的重要组成部件。作为复杂文本布局引擎,无论是Windows的Uniscribe还是OpenOffi......
舆情分析作为自然语言处理研究的重要分支,近年来越来越受关注。随着藏文信息技术的发展,藏语也迈入了自然语言处理时代,而针对藏......
随着网络的快速发展,越来越多的少数民族的人们通过微博来发表观点、表达情感、交流心得。藏文微博文本的研究不仅可以了解少数民......
在这网络与信息的时代里,搜索引擎成为人们获取信息的主要工具。有着悠久历史、文化的藏民族在这网络与信息的时代里对信息检索的需......
本文在对藏文字丁和藏文语法研究的基础上,利用于类别特征词向量的分类算法,采用Boosting算法构建藏文文本分类器,实现了根据藏文......
文章用GOOGLE开源的Word2Vec工具把藏文文本《贤者喜宴》经过分词后的语料作为输入,将文本中的词映射到一个K维空间,利用词汇的上......
随着藏文信息技术的不断普及和发展,搜索引擎技术成为藏文信息处理一项新的研究课题.对搜集到的藏文网页文本或用户查询关键词进行......
根据藏文特点和藏语语法结构,可研究藏文文本的向量空间模型、藏文文本特征选择、藏文文本权重计算、KNN藏文文本分类算法和查全率......
摘要:本文通过对藏文文本中不规范文本进行分类后,针对不同类型的文本特征制定规范化处理方法,最终实现了对藏文文本的规范化处理。但......
藏文文本数字水印在藏文电子公文安全方面具有非常重要的意义,但目前文本水印还存在着鲁棒性不强,水印容量不足等问题。本文针对上述......
藏文作为一门古老的语言有其独有的规则和特点。随着网络的普及,互联网用户中的藏族同胞迅速增加,网络上的藏文文本也越来越多。利......
[目的/意义]旨在为提升藏文文本关键词的抽取效果提供参考。[方法/过程]分析中英文文本关键词抽取方法的特点和存在问题,针对藏文......
针对藏文信息处理的需求,提出了一套层次化、基于规则的藏文文本规范化处理方案.首先分析整理了藏文文本中的不规范文本类型,然后......
本文在藏文问句预处理研究的基础上主要实现了基于知识融合的藏文分词标注,基于疑问词的藏文问句分类和基于TextRank的藏文关键词......
互联网文本数量持续爆炸式增长,用户通过互联网查找信息变得更加困难,响应时间得不到满足。针对藏文本身的语言学特点,探讨一种面向信......
随着互联网不断发展,境外反动势力利用网络传播不良信息呈愈演愈烈之势,尤其在藏文信息方面。利用最大熵模型,可对网络藏文文本进行分......
藏文文本的自动校对是藏文信息处理的主要应用领域之一,因此对于藏文文本自动校对方法的探究与之后的系统构建是非常关键的技术探......
藏文文本的自动校对是藏文信息处理的主要应用领域之一,现代藏文词的自动校对是其中重要的关键技术之一。本文根据藏文词错误的类......