基于NLP技术的中文网络评论观点抽取方法的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:jackieWXM
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户关于产品性能的评价,无论是对于厂家还是潜在购买者来说,都是很有研究价值的。厂家不仅需要了解对于自己产品的评价,也需要掌握有关竞争对手产品性能的反馈;而潜在购买者则希望从已经存在的评价中得到参考和建议。因此,观点抽取技术具有很大的研究价值。而Web已经成为消费者发表评论的重要途径,比如论坛,BBS,Blog等,这些已经成为观点信息的重要来源。但是Web上的信息是海量的,而且比较分散,如果依靠人工浏览查阅,将是一项费时而又低效的工作。于是,我们需要信息抽取技术。但是传统的信息抽取和信息检索研究的重点是针对客观表达的事实信息。因为观点是主观性的,因此我们需要能够自动抽取主观性观点的技术,从用户评论中自动抽取出针对每个产品特征的意见,并进行语义极性分析。语义极性分析和观点抽取是指利用计算机技术自动分析带有观点信息的句子或文档,从而提取出用户感兴趣的主题(topic)或特征(feature),并分析其语义极性倾向(褒义、贬义或中性)和强度。目前中文领域对于语义极性分析还主要集中在词语的极性倾向判断,和文档层次的极性分析,且都是基于统计方法,没有运用复杂的自然语言处理技术对句子层次进行分析。我们将尝试利用NLP(Natural Language Processing)方法,对中文句子的语义极性倾向进行研究。本文利用自然语言处理技术,对中文网络评论语句进行语义极性分
其他文献
一、异议登记申请的前提条件及提交的材料很难确定异议登记是更正登记之前所采取的一种临时措施。《物权法》第19条规定“不动产登记簿记载的权利人不同意更正的,利害关系人可
针对程序复杂度高的问题,提出在结构化程序设计中利用数学思维方法来进行代码剖析、发现客观规律并归纳抽象,从而实现编程优化的思路。结合Mc Cabe方法对程序进行复杂度度量,
以邻苯二胺与异硫氰酸苯酯为原料,制备得中间体N-(2-氨基苯基)-N′-苯基硫脲。然后将其与水杨醛反应得到标题化合物。通过元素分析、红外光谱、质谱及核磁共振氢谱对所合成的化
复数与形的关系是紧密联系的,这是因为复数集与复平面上的点集或向量(→OZ)的集合构成一一对应的关系.利用复数及其运算的几何意义,应用数形结合的思想,可以使许多复数问题变
标题化合物为改性的齐格勒-纳塔催化剂的内给电子体。比目前所应用的邻苯二甲酸酯在维持较高的立构规整度的同时更能提高催化剂活性,在工业生产中具有良好的应用前景。设计了
盐渍土作为一种特殊土,其组成中的氯化盐、硫酸盐常随着外界条件的变化而变化,从而造成盐渍土路面的翻浆、盐胀、溶陷等工程病害。针对南疆地区盐渍土特点,通过大量试验,分析确定
商务英语的发展历史悠久,而随着学科的交叉融合与学术的日益开放,商务英语语言学也逐渐发展起来,语言交际和文化传递丰富了当前的语言环境,也引导着商务英语向多模态趋势发展
在世界经济发展的历程中,中小企业数量之多,分布之广,贡献之大,已成为世界各国社会经济生活中的一种不容忽视的重要力量。同时,中小企业在推动地方经济增长和促进地方发展等
以醋酸铜与阿司匹林为原料,以甲醇为溶剂一步法合成标题化合物。产物经高效液相色谱仪、原子吸收光谱仪、红外光谱仪、X-射线衍射仪确定纯度和结构。