论文部分内容阅读
3G时代的到来极大促进了中国移动通信终端的快速发展。反观现有市场上通信终端的输入技术,可谓是“洋码奔腾”,甚至连中文搜索技术也需要依赖国外核心技术。加之人们文字信息交换频繁,一套快速高效的移动通信终端中英文搜索引擎至关重要,也迫在眉睫。本论文依托科技部创新基金“面向通信终端行业的应用软件技术资源共享服务”项目,以实现嵌入式通信终端中智能预测输入引擎为主要研究目标,解决现有输入计算复杂度高、识别率低的问题。通过对系统内核、字符串编码、数据结构的深入研究,针对现有统计语言模型存在的缺点,建立了一种分词组合的混合语言模型。基于此模型,论文提出了一种基于神经网络的多分级动态搜索算法,并按照评测体系进行算法质量综合评测。
文章针对现有输入技术输入速度慢,思维连贯性差的缺点,提出一种适用于移动通信设备输入的混合语言模型。与现大多采用的语言模型不同,本文设计的模型加入了分词组合特性,利用全键盘输入方式改善统计语言模型预测功能弱的缺点。模型通过提取已知字词的信息量,利用一阶马尔可夫概率估算相临字符间互信息量,并预测下一位字符。
论文在Mobile6.0平台上设计完成了该算法的相关代码实现,并成功移植到多普达D900终端设备中。为与其它搜索算法相比较,论文最后遵照国家文字信息处理标准GB/T18031-2000中字符信息输入标准,对三个重要指标进行算法质量综合评测。测评结果基于神经网络的多分级动态搜索算法可有效减小按键次数,提高输入效率。
文章针对现有输入技术输入速度慢,思维连贯性差的缺点,提出一种适用于移动通信设备输入的混合语言模型。与现大多采用的语言模型不同,本文设计的模型加入了分词组合特性,利用全键盘输入方式改善统计语言模型预测功能弱的缺点。模型通过提取已知字词的信息量,利用一阶马尔可夫概率估算相临字符间互信息量,并预测下一位字符。
论文在Mobile6.0平台上设计完成了该算法的相关代码实现,并成功移植到多普达D900终端设备中。为与其它搜索算法相比较,论文最后遵照国家文字信息处理标准GB/T18031-2000中字符信息输入标准,对三个重要指标进行算法质量综合评测。测评结果基于神经网络的多分级动态搜索算法可有效减小按键次数,提高输入效率。