论文部分内容阅读
《说文解字》(以下简称《说文》)是中国传统语言文字学的奠基之作。历代《说文》学的研究,凡取得成绩者,无不注意到其中所呈现出的多方面的、网络状的联系。但由于受到人的思维能力和研究工具的限制,传统的《说文》系联法难以穷尽地描绘《说文》构建的这个庞大复杂的周秦文献字词形音义的系统。信息时代《说文》研究的进一步深入要充分利用数字化技术。本文选择《说文》会意字构形为切入点,探索更好的利用数字化技术在存储、检索和计算方面的优势来辅助开展汉语言文字学研究的方法。本文在科学系统方法论的指导下,以现代《说文》学与汉字构形学的理论和方法为依据,充分吸收人工智能、计算机技术等领域的有益学养,在综合考察各种知识表示方法的基础上提出的“知识体”的概念,认为《说文》会意字构形的相关知识有不同的类型,也需要采用不同的知识表示方法进行数字化。在此基础上,借鉴《说文》学研究者的方法和经验,分别构建了《说文》会意字构形描述性知识、过程性知识和控制性知识的数字化模型,以期为《说文》及其相关研究提供进一步的佐证和思路。本文主体内容包括以下四个部分。第2章理论模型的构建。在阐明知识的概念及其分类并综合考察现有相关知识表示技术的基础上提出知识体的概念并构造《说文》会意字构形知识体,为进一步的研究奠定理论基础。第3章基础研究材料的数字化。借鉴古籍数字化与语料库语言学技术,构建《说文》会意字语料库,实现对《说文》会意字构形相关描述性知识的采集、加工和存储,为进一步研究提供基础资源。第4章知识库的构建。利用汉字构形学的理论和方法来分析《说文》中对会意字的字形说解,采用数学中的“树”模型来构建《说文》蕴含的会意字构形知识库,实现对《说文》会意字构形相关过程性知识的采集和存储。第5章研究系统的开发。以软件工程学的理论和方法为指导,开发《说文》会意字构形研究系统,实现对《说文》会意字构形相关控制知识的表征,进一步探索利用信息技术尤其是知识表示技术深化《说文》学研究的方法。