论文部分内容阅读
本文从形式化的角度讨论了汉语文本的形式结构及有关的基本概念,给出了文本的标题、子标题、段落及其层次结构的一种划分与标记方法,提出了规范的与准规范的文本等概念,并以此为基础讨论了文本形式结构的标引问题,给出了两个标引算法.本文阐明的方法和结果对汉语文本的全文文本标引及结构化分析具有直接的现实意义.