监督学习方法在语气挖掘中的应用研究

来源 :第九届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户：nose88

【摘要】

：

Web语气挖掘是一项具有较大实用价值的挖掘技术,这种技术对于消费者和商家作出决策都是很有帮助的。该技术的核心主要涉及语气分类问题,即判别一篇网页评论的观点倾向是肯定

【作者】

：

唐慧丰谭松波程学旗

【机构】

：

中国科学院计算技术研究所北京 100080

【出处】

：

第九届全国计算语言学学术会议

【发表日期】

：

2007年期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Web语气挖掘是一项具有较大实用价值的挖掘技术,这种技术对于消费者和商家作出决策都是很有帮助的。该技术的核心主要涉及语气分类问题,即判别一篇网页评论的观点倾向是肯定还是否定。本文主要研究五种常用的监督学习方法在语气挖掘中的应用,并在中文数据集上进行了实验。实验结果表明:采用N-gram特征表示方法、信息增益特征选择方法和SVM分类方法的情况下,语气挖掘能取得较好的效果。

其他文献

和苏联专家们相处的一些体会

在庆祝偉大的十月社会主义革命四十周年的节日里,我們怀着感激的心情想起这一偉大国家对我國的真誠友誼和無私帮助;也使我想起了和苏联?覀兿啻θ兆又械闹种只匾浜吞寤帷?在

期刊

药用植物苏联专家四十苏联国家他都不言我能我曹燕私家墓

SVM与错误驱动学习相结合的生物实体识别方法

本文介绍了一种SVM和基于转换的错误驱动学习相结合的生物实体识别方法。该方法首先通过抽取较为丰富的特征集合如单词特征、词性特征和词形特征等,使用GENLA语料对SVM分类器

会议

错误驱动学习方法生物学特征集合转换规则识别方法分类器语言现象训练文本命名实体词特征运用语料校正词性词形抽取

生物医学文献中的蛋白质相互作用关系抽取系统

从生物医学文献中抽取蛋白质(基因)相互作用关系对蛋白质知识网络的建立,蛋白质关系的预测,新药的研制等均具有重要的意义。本文提出了一个生物医学文献中的蛋白质相互作用关

会议

特定本体指导的信息抽取技术研究

信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。Ontology作为领域知识的共同理解,能有效的解决现在信息抽取所面临的主要挑战──知识工程

会议

通用开关电源原理与检修

本文通过对使用STR-F6565集成块为核心的开关电源工作原理的分析,剖析该集成内部的启动电路、驱动电路、振荡电路、开关调整管、过压保护等电路的工作原理、工作过程及其之间

期刊

开关电源过压保护电路原理工作原理振荡电路高频变压器启动电路浪涌电流原理图输出电路

基于相关性模型的中文话题跟踪研究

作为话题检测与跟踪的重要研究子课题,话题跟踪针对特定话题,识别后续信息流中的相关报道。针对话题本身的漂移现象,本文基于改进的相关性模型,对跟踪中伪相关反馈包含的新颖

会议

话题跟踪相关性模型向量空间模型新颖检测话题检测

基于内容相关度和语义分析的Blog热点话题发现

目前对话题识别和话题跟踪的研究非常多,但这大都是对新闻事件进行分析,Blog是目前Internet上一种非常重要的媒体,它可以提供给用户方便地发表自己的观点并可以对其他人的观

会议

信息抽取热点话题语义分析内容相关度话题识别话题跟踪

热点事件发现

每年都会有一些机构通过媒体发布当年的热点事件,这些事件通常都是由人工进行筛选。本文提出一种方法来自动地发现热点事件。使用从新闻网站上下载下来的2006年的网页内容,通

会议

事件发现增量聚类热点事件新闻网站网页内容

基于聚类引擎的话题褒贬度计算

互联网是人们表达各种观点的重要媒介,自动获取网络上对话题的褒贬态度是自然语言处理的一项新兴课题。本文提出了利用两种搜索引擎进行话题褒贬态度计算的方法。首先,利用聚

基于贝叶斯模型的词汇情感消歧

词汇情感消歧是基于文本的情感计算的重要组成部分。本文分析了词汇情感消歧的特征,并使用自动获取和人工验证的方法确定多情感词汇。在词汇情感消歧部分共做了4个实验──基

会议

情感计算情感消歧多情感词汇贝叶斯模型词汇情感

监督学习方法在语气挖掘中的应用研究

与本文相关的学术论文