一种半监督学习的中文微博主观句识别方法

来源 :计算机应用研究 | 被引量 : 7次 | 上传用户:coolsun070279
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博中的主观句包含着人们对事物的态度、倾向等信息。微博本身字数的限制和语言结构的自由,使得在微博中发现主观句面临着许多困难。借鉴传统文本处理使用的词性和情感词典两类特征,通过AdaBoost方法选择并组合分类器。对于已标注数据比例较小的数据集,为了进一步提升分类器的性能,尝试着通过Bootstrapping过程迭代重构分类器,也就是不断地通过已有的分类器标注未标注数据集中的可信句子,并加入已标注数据集中,再重新训练分类器。实验结果表明,Bootstrapping的引入不仅能够提升分类器的F值,而且能
其他文献
从客运专线市场化运营趋势出发,针对如何通过客票价格的动态调整来最大化客运专线期望收益的问题,基于旅客保留价格,结合已知客票价格和订票旅客到达概率,根据Bellman最优化原理建立了动态规划模型,进而探讨了最优动态票价调整策略的结构特征,证明了包含两个区段客运专线网络的最优动态票价调整策略的阈值特性,并通过算例进行了验证。
作为典型的不规则算法,稀疏矩阵向量乘的计算过程具有非常低的访存局部性和计算访存比,因此在基于cache的通用处理器上计算效率很低。提出了一种面向可重构计算平台的基于IEEE-754浮点数据格式标准的稀疏矩阵向量乘算法加速器的设计。在一维划分的行压缩稀疏矩阵数据存储技术以及计算部件的流水化设计的基础上,提出了一种基于单个浮点加法器的无阻塞累加器设计。通过实验验证表明,简化了算法的设计提高了算法执行的
为了实现异构模糊本体之间的知识共享和重用等语义互操作,需要为它们建立映射关系,为此提出了一种新的模糊本体映射方法 VSM-FR(vector space model based on fuzzy relation)。VSM-FR方法首先利用模糊本体中的模糊关系构建向量空间模型;然后将模糊概念表示成此向量空间模型中的向量,这样模糊概念之间的相似度就可以通过向量运算的方法来获得;最后为相似度大于给定阈
本研究采用症状自评量表(SCL-90)对吉首大学593名少数民族预科生进行调查。分析并掌握少数民族预科生的心理健康状况,为高校开展少数民族学生的心理健康教育提供一定的理论依
根据新工科教学理念,在功能高分子材料课程教学中引入问题导向教学模式,旨在探索新工科背景下学生创新意识、创新思维和创新能力培养的有效途径。从问题导向教学模式的组织过
为使学生较好、较快地掌握绘图和看图能力,提出了基于构型设计的工程图学教学新内容。分析了构型设计教学思路、特点及方法,通过基图、拉伸线、布尔运算等构型要素分析形体并
中国经济的快速发展和'一带一路'战略的深入推进对中国大学的韩国语教学提出了新的要求。文章从大学韩国语教学的实际需求出发,针对当前韩国语专业的基础、核心课程&
《机械原理》因为理论性较强、难以理解而导致学生兴趣不足,影响学生对基础知识的掌握和工程实践应用。解决学生学习兴趣不足的问题,构建公平公正的平时成绩考评体系是一条重
广西桂西南地区是指南宁以西如崇左、百色等市县为主至越南边境的区域,是壮族人民的主要聚居地。该地区声乐演唱和学习者受这种区域性母语先入为主的作用影响,导致方言对学习
针对基本蝙蝠算法存在着易陷入局部最优、后期收敛速度慢等问题,提出了采用机动飞行的蝙蝠优化算法。该算法中每只蝙蝠根据其当前在群体中位置的优劣情况选择不同的飞行模式,处于较优位置的蝙蝠选择机动飞行模式,随机变轨逐步向群体最优位置靠近捕获猎物;而处于较差位置的蝙蝠选择非机动飞行方式,随机移动捕获猎物。为表明所提出算法的有效性和正确性,通过九个典型的基准函数优化实验测试,实验结果表明,该算法具有较好的优化