基于知网的中文问题自动分类

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:GaryCong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统应能用准确、简洁的答案回答用户用自然语言提出的问题。问题分类是问答系统所要处理的第一步,分类结果的正确率直接影响后续工作的进行。本文提出了一种使用知网作为语叉资源选取分类特征,井使用最大熵模型进行分类的新方法。该方法以问题的疑问词、句法结构、疑问意向词、疑问意向词在知网中的首义原作为分类特征。实验结果表明。在知网中选取的首义原能很好的表达问题焦点词的语义信息,可作为问题分类的一个主要特征。该方法能显著地提高问题分类的精度,太类和小类的分类精度分别达到了92.18%和83.86%。
其他文献
针对官地矿易自燃煤层28417综放工作面拆除期间易着火情形,分析了造成自燃发火的危险因素,提出一条双通道快速拆架综合防灭火新思路,在官地矿28417综放拆架面采用人工-传感器
《借我一生》是余秋雨对中国文化界的"告别之作",其行文间诗化的语言特色散发出其散文的独特魅力,而其中所使用的修辞格更是丰富多彩,谐趣横生,本文以《借我一生》中的句子为例
本文首先讨论了汉语方言辨识的依据及特征选取的基本原则,并由此导出了区间差分倒谱特征。然后利用GMM符号发生器和N元语言模型及ANN建立了一个方言辨识系统,该系统与传统的语种识别系统相比,具有以下特点:第一,系统不需要标注好的语音库,从而降低了汉语方言语音库建设的劳动强度和要求;第二,GMM符号化器计算量远远低于音素辨识器,从而提高了方言辨识速度,便于今后实时处理。第三,具有更高的辨识效果和更好的容
文章采用文献资料法、问卷调查法、数据统计法和对比分析等方法,对咸宁学院体育学院体育教育专业本科培养目标定位及学生认知状况进行调查与分析,为咸宁学院体育教育专业今后