论文部分内容阅读
由于适用性、性能等方面的问题,现有古汉语识别算法无法满足半自动构建楚辞语料库的要求。本文结合程序处理与传统文献研究方法,制作具有语义特征的楚辞词表。利用开源平台设计满足楚辞行文语法的规则,准确标注楚辞文档。通过选取不同题材的楚辞进行测试,调整词表、规则的适用性,提高计算机在楚辞语料库建设中的参与度,同时也提出一种先秦文献处理的新思路。