【摘 要】
:
通过扩充情感词典词基数,新建中立词词典,引入网络流行词等方式丰富情感词典,提高分词后情感词匹配的准确性;以某评价类网站网民评论作为原始数据进行分词,提取相应的正向情
【基金项目】
:
中央高校基本科研业务费专项资助(Grant No.3132016308)
论文部分内容阅读
通过扩充情感词典词基数,新建中立词词典,引入网络流行词等方式丰富情感词典,提高分词后情感词匹配的准确性;以某评价类网站网民评论作为原始数据进行分词,提取相应的正向情感分数,负向情感分数,中立情感词个数,评论情感总分值等特征,通过对连续数据的规约提炼离散属性,按照信息增益最大原则生成决策树进行评论的情感分类,去除小概率节点后进行两次实验,对好评的识别率达到90%,对差评的识别率达到92%。对中评的识别率达到75%。
其他文献
随着信息网络的发展.信息网络拓扑维上卷逐渐成为本领域的一个热点,同时它的应用价值也随之提升。对给定节点不上卷.其他节点上卷到指定层次的方法来满足用户的特定需求。提出满
In this paper, global robust stability of uncertain stochastic recurrent neural networks with Markovian jumping parameters is considered. A novel Linear matrix
某酱菜厂在10年前其产品就获得了市级名牌的殊荣,在当地同行业中排行"老大",生意兴隆,产品畅销,经济效益可观.可是该厂陶醉在名牌带来的一时成功之中,满足于增加福利,多发奖