论文部分内容阅读
为解决专利文档的自动化分类,根据机械领域专利文本的特点,提出了一种基于卷积神经网络与随机森林的机械专利文本分类模型。该模型应用卷积神经网络作为有监督的文本特征提取器,结合随机森林作为分类器,面向机械领域专利文本进行专利文本分类。该模型被应用在包含96类的107302份英文机械专利文档的数据集上。实验结果表明,该模型相比k近邻,Na?ve Bayes,随机森林等经典机器学习算法在准确率,召回率以及查全率方面均有显著提高。