基于词性标注序列特征提取的微博情感分类

来源 :计算机应用 | 被引量 : 10次 | 上传用户：pandanemo

【摘要】

：

传统的n-gram文本特征提取方法会产生高维度的特征向量,高维数据不但增大了分类的难度,同时也会增加分类的时间。针对这一问题,提出了一种基于词性(POS)标注序列的特征提取方法,根据词性序列能够代表一类文本的这一个特点,利用词性序列组作为文本的特征以达到降低特征维度的效果。在实验中,词性序列特征提取方法比n-gram特征提取方法至少提高了9%的分类精度,降低4816个维度。实验结果表明,该方法能够

【作者】

：

卢伟胜郭躬德陈黎飞

【机构】

：

福建师范大学数学与计算机科学学院

【出处】

：

计算机应用

【发表日期】

：

2014年10期

【关键词】

：

特征提取词性标注序列微博情感分类极性分类 feature extraction Part-Of-Speech （POS） tagging sequenc

【基金项目】

：

国家自然科学基金资助项目（61175123）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于信息安全体系实现靶场事后数据处理系统

信息安全日益成为靶场试验需要面临和解决的现实问题。论文基于网络和数据库技术,采用先进的信息安全手段,构建一个高效稳定的信息安全体系,从而为靶场事后数据处理和管理提

期刊

数据处理信息安全权限密钥data processing information security privilege key

水下设备辅助量数据采集系统设计与实现

水下设备辅助信息的监测是保证系统正常工作和进行有效数据分析的重要环节。论文系统充分考虑各类传感器的输出形式,基于网络总线和CAN总线实现了各类辅助测量模块的网络连接

期刊

水下设备传感器监测CAN总线underwater equipment sensor monitoring CAN bus

锌（Ⅱ）与原卟啉显色反应的分光光度法研究

本文研究了Zn（Ⅱ）与原卟啉的络合显色反应条件。实验结果表明,表面活性剂吐温80质量浓度为1.0%时,在pH9.50 NH3.H2O-NH4Cl缓冲溶液中,沸水浴加热15min,显色反应完全,形成稳定的

期刊

锌显色反应原卟啉分光光度法

基于图像检测的双绞线绕距测量方法

针对双绞线绕距测量,提出了一种图像检测框架。此框架通过图像分割、修复、细化、拟合以及比例尺的设置,可实时计算出双绞线绕距值。在此框架下,针对传统二维最大类间方差法——Otsu运行时间较长的问题,提出了一种新的基于区域斜分的快速算法。快速算法通过对二维直方图区域重新划分,结合快速查找表以及递推算法,大大减少了分割时间。针对图像缺失的问题,采用了基于边缘检测的算法对其特定区域进行填充修复,并对修复后的

期刊

双绞线绕距测量最大类间方差法图像修复图像细化最小二乘法twisted-pair wire pitch measurement maximum bet

资中旅游资源的现状和开发—以文庙、重龙山和罗泉镇为例

历史文化休闲旅游已经成为时下流行的旅游消费形式，这既有利于发掘其深厚的历史文化内涵，提高城市知名度，也有利于当地的经济发展。资中保留了大量的历史文化遗迹，但现在还处在开

期刊

历史文化资源现状旅游开发社区参与

发展绿色产业开发有机食品

本文就有机食品这一新兴的绿色产业,从开发有机食品在实现农业产业结构调整战略中的作用、赤峰市有机食品资源现状及开发优势、开发有机食品的总体思路等方面探讨了赤峰市开

期刊

绿色产业有机食品产业结构生态农业development the organic food

军队采购中的询价策略探析

军队采购是以最优的质量、最合适的价格、最恰当的时间、最适当的数量，从合格的供应商处获取所需要的物资、工程和服务，保障部队的需要。军队采购方与供应商形成一种买卖博弈或

期刊

军队采购询价策略机制military procurementinquirystrategymechanism

基于词性标注序列特征提取的微博情感分类

其他学术论文