从句法分析看词性标注

来源 :现代语文(语言研究版) | 被引量 : 0次 | 上传用户:yaci
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词性标注是语言研究者进行句法分析和其他研究的基础,其划分是否得当直接影响着语料库的下一步建设。本文从句法分析实际操作的角度对国内几个常用分词系统的词性标记问题进行了对比分析,着重探讨了其中一些标记给句法标注带来的问题,如习用语和简称、前接成分和后接成分。针对这些问题,本文从实用的角度,在参考多方建议的基础上,提出了相应的标注策略。 Part-of-speech tagging is the basis for linguistic researchers’ syntactic analysis and other studies. Whether the classification is appropriate or not directly affects the construction of the next corpus. In this paper, we analyze the part-of-speech tagging problems of several commonly used word-segmentation systems from the perspective of syntactic analysis and practice, highlighting some of the problems caused by tagging, such as idioms and abbreviations, ingredient. In response to these problems, this article from the practical point of view, based on the reference to multi-party proposal, put forward the corresponding labeling strategy.
其他文献
传统的大型LED显示屏系统以单片机MCU、ARM或PLD为核心控制芯片,以FPGA为核心的LED显示屏控制系统设计实现起来比较复杂,并且需要以高性能的FPGA芯片作为基础,而以微处理器为核
志书专题资料的含义,主要是指按照志书编纂要求去搜集资料的专门调查资料,其有叙有议、有分析论证,具有一定的研究深度,能反映出一定的经验教训、利弊得失,十分宝贵。按照修志的要