论文部分内容阅读
中文信息处理是利用计算机对汉语信息进行自动处理,其中实现汉字输入是该领域内一项基础而又重要的工作。虽然已经有不依靠键盘输入汉字的产品问世,但汉字键盘输入法还是最普及的方式,也是中文信息处理领域中一个很重要的课题。目前,许多汉字键盘输入法通过引入智能处理技术以达到易学易用的目的。为了提高输入法的智能性,研究者通过对现有智能输入法的分析研究,设计出了汉字语法语义智能输入法。本文在汉字语法语义智能输入法总体设计基础上,引入中文信息处理领域基本理论的研究成果----词语搭配知识库、语法和语义搭配知识库,对汉字语法语义智能输入法中各个核心算法的设计与实现技术进行了详细描述。主要工作如下:1.介绍汉字语法语义智能输入法总体设计思想,给出该输入法的整体结构,确定其各个模块要实现的功能;简单介绍汉字语法语义智能输入法中采用的中文信息处理领域基本理论的研究成果----词语搭配知识库、语法和语义搭配知识库;并给出各算法描述过程中所需的定义。2.详细描述了汉字语法语义智能输入法主要功能模块----候选字词集生成模块、候选列表生成模块以及自学习模块中的核心算法。候选字词集生成模块的核心算法主要包括编码预处理算法和候选字词集生成算法。候选列表生成模块是整个系统最主要的模块,主要核心算法包括候选字词调整算法、候选矩阵生成算法、初步词网格生成算法、语言元素结点的生成算法、寻找最佳语句候选算法以及无编码候选列生成算法,无编码候选列生成算法利用对用户已输入的汉字进行切分标注,通过系统中的知识库信息在没有输入编码的情况下预测后续的输入。自学习模块包括字词频调整算法和用户词表管理算法。3.介绍了汉字语法语义智能输入法核心算法实现所需主要技术、软件环境。汉字语法语义智能输入法采用当前流行的VC++.NET编程,对Windows操作系统提供的API函数----IME接口函数进行设计与修改。