论文部分内容阅读
传统中文评价搭配抽取采用的最大熵和条件随机域等算法依赖于人工选取特征,且对前期语义标注精度要求较高.本文提出一种使用词向量代替传统语义特征进行搭配抽取的方法.其中词向量通过深度学习模型在大规模语料上进行无监督学习得到.实验中将词向量及语义特征分别作为三种机器学习模型的输入,结果表明使用词向量在神经网络模型中取得了较好的效果,其精度、召回率都比使用语义特征最好情况高出接近3%,同时,我们发现随着无监督学习训练语料的增大,得到的词向量也越来越实用.