基于SVM和特征相关性的微博新词发现研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户：zzjokok

【摘要】

：

为了对微博语料中的新词进行有效的识别,针对微博语料独有的文本特性,该文提出基于SVM和特征相关性的微博新词发现方法。采用N元递增模型得到候选词集合以及每个候选词的基础

【作者】

：

韩修龙

【机构】

：

西南石油大学智能与网络化系统研究中心

【出处】

：

电脑知识与技术

【发表日期】

：

2018年1Z期

【关键词】

：

自然语言处理新词识别支持向量机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了对微博语料中的新词进行有效的识别,针对微博语料独有的文本特性,该文提出基于SVM和特征相关性的微博新词发现方法。采用N元递增模型得到候选词集合以及每个候选词的基础特征向量,并结合已有的词典和部分人工标注进行正负样本的标注。通过相关性分析构造新的候选词特征,并构造新的特征向量。然后利用SVM模型训练得到最大间隔分离超平面并对测试集中的语料进行新词判定。通过对比实验验证了该方法的有效性。

其他文献

高度关注意大利银行业的危与机

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技

期刊

银行业中资银行不良贷款意大利

未来教育工作者的民族文化教育能力问题研究

现代教育实践中呈现出文化多元性与民族性特征,这种多元性体现在地方的多元性、民族的多元性、教育阶段的多元性及延续性等方面。其中,教育能力、文化教育以及成人教育三个方

期刊

俄罗斯高等教育阿穆尔州多元文化教育民族文化教育Russian higher education Amur Multi - culture educat

自然与人性——中国山水画的文化情怀

山水画作为中国画的一个分科，在中国绘画艺术中占有及其重要的地位，代表中国画的高峰。论及中国山水画，不能只停留在绘画本体，而要着眼于时代与文化精神。理解中国文士的精神价值

期刊

自然人性山水画文化情怀nature humanity landscape painting cultural feelings

路面沥青摊铺平整度研究

文章主要介绍了保持路面沥青摊铺平整度的必要性,通过对现阶段影响路面沥青摊铺平整度的因素进行分析,探讨提高路面沥青摊铺平整度的有效措施,以转变传统的路面沥青摊铺施工

期刊

路面沥青摊铺平整度有效措施

中小学避险体适能体育课程的应用研究

期刊

避险体适能体育课程应用

基于SVM和特征相关性的微博新词发现研究

与本文相关的学术论文