论文部分内容阅读
与丰富的英语口语语料库相比,汉语口语语料库的建设仍相对滞后。因此,建设并完善汉语口语语料库和转写规则具有较为重要的现实意义。在论述建设小型汉语本族语者口语语料库(CNCC-Corpus of Native Chinese Conversation)的实践意义——为了做跨语言对比研究和纠正口语语料的倾斜性问题之后,集中论述了CNCC语料的采集、文本转写与标注准则。最后,分析和阐述了该语料库在跨语言的会话分析领域的应用现状以及后续的语体和汉字分词等方面的完善计划。