论文部分内容阅读
中文叙词表本体(Onto Thesaurus)融合了叙词表与本体,是一种同时具备二者特征的知识组织系统。“中文叙词表本体共建共享系统”(OTCSS)是中文叙词表本体的配套系统。本文在充分借鉴“定义抽取”已有研究成果的基础之上,设计了面向综合性中文叙词表本体的叙词概念定义抽取方法以及基于OTCSS的定义注释自动构建框架,获得了良好的实验效果,即将应用于实际的OTCSS系统。其中,基于“高频词与句子向量”和“TFIDF向量”两种定义抽取算法提出的二维相对量的融合算法,能够更有效地抽取出前两种方法的良好结果,有效信息提高比一般可达到60%。