【摘 要】
:
目前NLP(Natural Language Processing,自然语言处理)已成为机器学习的研究热点之一。文本分类是NLP处理技术的重要分支。本文采用期刊论文作为实验数据,研究了中文文本分类
论文部分内容阅读
目前NLP(Natural Language Processing,自然语言处理)已成为机器学习的研究热点之一。文本分类是NLP处理技术的重要分支。本文采用期刊论文作为实验数据,研究了中文文本分类问题,并提出了两种分类模型。一种是基于权重预处理的中文文本分类算法PRE-TF-IDF(Pre-processing Term Frequency Inverse Document Frequency,文本预处理的词频逆文本频)。传统词频算法在对词加权时仅考虑词的出现频率而不考虑词在文本中的位置。PRE-TF-IDF算法通过在TF-IDF(Term Frequency Inverse Document Frequency,词频逆文本频)算法基础上增加权重预处理和词密度权重两个环节,提高了文本分类的准确性。另一种是基于卷积神经网络和支持向量机结合的文本分类模型CNNSVM(Convolutional Neural Network and Support Vector Machine Classifier,卷积神经网络与支持向量机分类器结合模型)。在传统卷积神经网络模型的基础上,增加了注意力机制,同时简化了模型的参数,并使用基于支持向量机的分类器替代传统模型中的softmax层实现文本的分类。提升了特征词语的提取效果,并解决了softmax层泛化能力较弱的问题。
其他文献
目前世界各国有关国家工作人员的任用大体有四种制度,即委任制、聘任制、选任制、考任制。委任制和事实上的终身制都不适应市场经济。改革用人制度,建立适应社会主义市场经济的
GNSS卫星导航定位技术在测绘、通信、军事、航天、电力、遥感等领域得到了广泛的应用。随着GNSS卫星导航技术应用范围的不断扩大,应用水平的不断提高,对卫星导航技术也提出了
学生的情感因素是产生听力障碍的主要原因,他们的紧张焦虑直接影响着对材料的理解程度.如何消除这一不利因素,增强他们的听力能力,是引起我们注意的问题.本文从"创造环境","
乌和尔楚鲁图钼矿是二连-东乌旗成矿带新发现的一处中型隐伏斑岩型钼矿床。根据最新的矿床勘查成果,详细分析了矿床地质特征、物化探异常特征、矿体及矿石特征,简要评述了控
传统流体包裹体PVTx模拟应用包裹体组分、气液比和均一温度,结合模拟软件可以恢复包裹体被捕获时的古流体压力,然而组分参数受多因素影响而难以确定,导致精度有限。介绍了Pin
王九思是明代中期一位较为重要的文学家。在其现存的830首诗歌中,有愤世嫉俗之诗,有忧国忧民之诗,有隐逸闲适之诗,也有怀古忆旧之诗;其诗作苍古悲凉,意境浑厚;质朴清新,不事雕琢。
收稿日期:2014-03-12 作者简介:施力仁(1965-),男,中山市中等专业学校计算机讲师、自动化工程师。研究方向:计算机应用教学、应用软件开发、自动化控制业学校。(广东中山/528437)摘要:行为导向教学法在《电子商务概论》课程教学中的实践与应用,改变了传统的教学模式,为学生提供了更加有效的学习环境,能把理论与实践有机的结合在一起,不仅有利于学生理解和掌握书本的理论知识,更使他们懂得如
本文分析了近十几年来我国电子海图的应用领域,指出了电子海图的应用和技术进步所亟待解决的问题,并提出了解决这些问题的办法.
极简主义并不仅仅意味着简单,它是对文化的一种提炼,运用一系列的单体元素,达到去伪存真、返璞归真、简单明了、简约时尚的效果,并提炼出的新概念。极简主义在后现代时期的众