【摘 要】
:
音字转换是指由计算机自动地将拼音串转换为汉字串。音字转换技术是中文信息处理领域一个重要的研究方向,在语音识别、中文拼音输入中都有广泛地应用,是一个极具挑战性的问题
论文部分内容阅读
音字转换是指由计算机自动地将拼音串转换为汉字串。音字转换技术是中文信息处理领域一个重要的研究方向,在语音识别、中文拼音输入中都有广泛地应用,是一个极具挑战性的问题。音字转换系统的关键技术包括语言模型、拼音串的切分和解码算法。本文重点分析了语言模型训练过程中出现的零概率问题,研究并实现了三种数据平滑的方法,并对三种算法的性能作了测试,实验表明使用这三种平滑方法训练的语言模型信息熵在5-7之间,效果相当。为了解决汉语长距相依的问题,本文对中文高频词串(CFS)提取算法作了改进,以期解决CFS的层次不足和剔除语意不明CFS的问题。使用本文的改进算法和基于字符串切分度的CFS提取算法分别训练语言模型,并应用到音字转换的实验中,实验表明前者转换的正确率优于后者。针对jieba分词工具没有考虑到词与词之间的上下文关系,对jieba分词工具进行了修改,增强了分词的效果。基于规则的拼音串切分方法不能很好的处理切分歧义的问题,为此引入了知识库,在此基础上修改了切分方法,并将切分的正确率提高了0.9%。本文设计和实现了音字转换系统,在普通的音字转换系统的基础上增加了学习模块,使系统能够学习用户的输入习惯,提高了用户的体验。在使用Viterbi算法解码的情况下,转换的正确率达到了90.3%。
其他文献
随着传感器技术、微机电系统、现代网络和无线通信技术的发展,由大量传感器节点组成的无线传感器网络(Wireless Sensor Networks,WSNs)逐渐引起了学术界和工业界的高度重视。无
随着当前经济的快速发展,各行各业都逐渐兴起。化工经济就是在经济与科技等多重发展下所形成的一种特殊的经济形势。该种经济产业与传统的经济产业存在一定的差距,且传统的管
盲信号处理(Blind Signal Processing,BSP)是20世纪最后十年中迅速发展起来的一个研究领域,它又可以分成若干个互相关联而目标有所区别的子领域,如盲信号分离(Blind Signal Sepa
应用型本科院校财务管理课程教学目标是培养实践能力强、综合素质较高的财务管理人员。但目前,财务管理课程和现实需要严重脱节,所以必须加强对财务管理课程教学改革。为了实
根据国家相关文件精神,辅导员培训工作得到极大重视.本文将CTOM模型四位一体化培训体系引入辅导员培训中,以课程体系为指导,以讲师体系为依靠,以组织体系为保证,以管理机制为
发展基于软件无线电思想的GPS软件接收机技术是适应GPS新技术、新算法,并与其它全球导航卫星系统(CNSS)相互兼容、相互并存的有效解决方法。本文采用了以GP2015为主芯片的射
在生物特征识别中,人脸识别技术占有极为重要的地位,它是模式识别与人工智能的研究热点之一。人脸识别在安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互、公安
为提高石油企业的生存和竞争能力,降低生产成本,提高劳动效率,减少安全隐患,是油田当前和今后一个时期的一项主要任务。抽油井工况监测和数据采集智能系统的设计实现,正是迎
近年来,随着因特网的迅猛发展,基于分组传输的通信网络已经处于主导地位。为了能够更好地保障信息的无差错传输,差错控制编码技术在通信协议的应用层也获得越来越多的应用。
随着网民和网页数量的急剧增加,互联网出现了“带宽瓶颈”和“信息垃圾”等问题。播存网络通过镜像并广播互联网上特定的主流资源或高热度信息资源,实现无冲突的信息共享。论文