基于特定领域的汉语句子意见挖掘

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:longyouxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英特网上的信息与日剧增,蕴藏着巨大的信息量。对产品的各种评价出现在各大论坛、电子公告板以及门户网站上,厂商需要了解顾客使用其产品的反馈意见,潜在的购买者也需要做出是否购买某个产品的决定。因此,意见挖掘技术应运而生。本文实现了一个基于领域的汉语句子意见挖掘系统(OMS)。该系统主要解决了意见挖掘问题中的主题识别、陈述定界和极性分析三个子问题。系统主要包含基于模式匹配的陈述选择模块和基于核函数的意见分析模块。在陈述选择模块中,我们提出了基于SPD n与SND n特征选择的单一/混合意见句识别算法,介绍了基于汽车本体的主题抽取的过程,并说明了混合意见倾向句陈述的细颗粒度分析方法。我们提出了基于“投影映射”规则的模式生成策略,以及直接模式、结点模式、混合模式三种匹配策略。针对意见倾向分析模块我们提出了基于核的意见分类思想,它通过计算输入陈述之间的极性相似度对句子的极性进行识别。通过良好的核函数定义,基于核的方法能够从上下文和句法层面捕获极性信息,从而可以提高分类的准确率。
其他文献
机器人足球比赛目前已成为人工智能应用技术研究的重要实验平台,引起了越来越多的学者的关注。足球机器人系统分为四个子系统——机器人子系统、视觉子系统、决策子系统、通讯
对于传统的RFID系统来说,其阅读器通常是固定的或者使用专用的手持设备,只适用于特定场景。随着移动智能设备的快速普及,配置迅速提升,将移动智能终端与RFID网络的优势结合起
随着信息技术的迅速发展,信息化建设过程中积累了大量有用数据信息。但由于建设时期或开发部门的不同,这些数据资源形成了一座座“信息孤岛”,使得数据的查询和访问非常困难,数据
随着网络的普及,电子邮件与人们的工作生活联系日趋紧密,随之而来的垃圾邮件问题日益严重。在分布式垃圾邮件处理领域,基于Nilsimsa摘要的垃圾邮件识别技术和基于信誉机制的垃圾
图像配准是对不同时间、不同角度所获得的同一场景的多幅图像进行最佳匹配的过程,即将图像对齐后,明确图像空间位置变化与强度变化,然后确定图像序列之间位置映射关系或强度
随着互联网的快速发展,人们已经从信息匮乏时代进入了大数据时代,和搜索引擎一样,个性化推荐系统也是一种帮助用户在信息过载的情况下快速发现有用信息的工具,它依据用户的特
进销存管理是企业经营管理中的核心环节,中小企业的进货、销售和库存信息量非常庞大,如果能对这些数据进行统计分析,就可以利用这些分析结果进行相关的决策。在企业建立一套完善
随着民航信息化程度日益加深,各航空公司的订票系统中都积累了大量的旅客订座记录(Passenger Name Record,PNR)数据信息。在常旅客VIP会员制度不能对旅客出行形成有效吸引力
短信防火墙的基本功能是对新到短信进行过滤,根据用户设置作出相应的处理,以避免垃圾短信的骚扰。本文从用户需求角度出发,提出短信防火墙在基础性的短信过滤功能之外,还应提供以
人事管理部门在任何企业都是一个非常重要的部门,在高校也不例外。因此人事管理的好坏对判断一个企业或者一所高校它未来的发展有着很重要的作用。目前在高校人事部门中有办公