汉英-泰互译有声语料的数据库研究

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:aspiis6sql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
"汉英-泰互译有声语料库"的开发,在泰文舆情分析领域,解决了词典分词算法中训练语料缺乏的问题.本文采用计算机化信息处理技术,对大量的收集来的泰文语料进行整理、规范、加工与存储,统计出泰文词汇8000多个.然后利用词典翻译和人工校对其进行语料对齐.最后,结合泰文语言语法特征以及句法的语义特点,分类归纳和规范标注泰语语料,构建了5万条左右的的汉英-泰语料数据库.
其他文献
视频压缩是视频会议中的核心技术,压缩技术的好坏决定着视频会议质量的高低.H.264是一种高性能的编解码算法,具有较高的压缩比和较好的网络适配性.对H.264编解码算法中的关键
基于信息化系统的特点及其对权限控制的需要,在.NET框架下,基于RBAC模型设计与实现了一套权限控制组件,并在设计过程中对RBAC模型进行了扩展,引入了权限委托、分级授权,UBAC
传统的协同过滤推荐算法面临严峻的数据稀疏性和推荐实时性困境,推荐质量明显不高.为提高推荐效果,首先对基于云模型的用户评分项和相似性度量方法展开研究.然后定义基于云模
内存计算技术的提出和发展,是基于实际情况的需求.对诸多行业来说,其在数据处理方面存在各种各样的问题及困难,诸如数据处理量极大、数据处理效率偏低、处理速度慢等,电力行
为了提高情感识别的准确性,该文以语音信号为研究对象,提出了一种新型的语音情感识别方法.将局部保持投影算法(LPP)的思想融入到主元分析(PCA)的目标函数中,使得在原始变量空间投
报告了制造企业管理信息系统重构技术发展的现状, 剖析了其中存在的不足, 即目前重构技术不能很好地支持企业用户自主实施系统重构, 引出信息系统重构技术进一步发展目标。提
针对目前在线学习系统中存在的不足,探讨如何有效地运用数据挖掘技术建立智慧的在线学习系统.从大量的用户数据中挖掘出关联关系,用以提供全面个性化、定制化的学习过程序列.
在车辆自组织网中,针对安全消息广播的有效覆盖及竞争冲突问题,本文提出了基于概率及退避等待的广播机制(VANET Broadcast Mechanism based on Probability and Backoff,VBM-PB).该机制隶属于接受者机制,其复杂度低并且具有完全分布式计算特性.VBM-PB将车辆的地理位置信息和节点负载结合,计算各节点潜在的转发概率;构造概率转发函数并设计自适应退
提出一种基于双GPS的振捣棒定位算法.该算法首先获得GPS精确定位的坐标数据,并将所得坐标数据反馈至单片机.然后在单片机中经过该算法的整合处理,最后得出振捣棒的位置坐标.
模仿人类行为的HTTP洪水是一种分布式拒绝服务攻击.提出一种抵御方法,它包括三个关键点:使用会话号标示请求者身份,通过分析单位时间的请求消息序列发现傀儡主机,通过丢弃或修