面向产品评论的意见挖掘关键技术研究

被引量 : 0次 | 上传用户:wangshuo3246
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,其上的信息越来越丰富,成为人们获取所需信息的主要手段。人们可以将自己的言论信息通过互联网展现出来,比如存在于互联网中的各大网站论坛。人们在挑选电子产品的时候,可以通过查阅相关产品论坛的用户评论,间接了解到相关产品的口碑。然而,这样的原始信息存在明显的缺点:信息庞杂,混沌。人们通过简单逐条的去查阅用户评论,得到相关产品的口碑信息,无疑是一项繁琐而耗时的任务。如果能够将这些信息进行有效的汇总,必将提高人们的获取信息的效率。基于这样的需求,本文构建了一个面向手机产品评论的意见挖掘系统,主要的研究内容包括以下几个方面:第一、本文介绍了系统的有用评论分类模块。有用评论的分类模块是整个意见挖掘系统的首要一步,因为原始的用户评论良莠不齐,无用的评论对于系统的后续模块不仅没用,而且会有副作用产生。基于有用评论的定义,本文采用支持向量机分类器进行分类,并引入产品特征词和情感词共现的特征。实验证明,上述共现特征的引入可以提高分类的效果。第二、本文详细介绍了系统的情感块识别及情感分析模块。该模块是整个系统的核心模块,其任务是识别评论中带有情感倾向的短语。本文将其转化为一个词序列标注问题,使用引入模板特征的条件随机域模型进行情感块的识别并判断它的情感极性。实验证明,使用条件随机域模型不仅可以识别传统方法所能识别的包含情感词的情感块,还可以识别很多口语化的情感块,这些情感块可能不包含情感词。另外,引入模板特征可以进一步提高识别的效果。第三、本文介绍了系统的产品口碑汇总模块。本模块主要分为两步:产品特征词-情感块对的挖掘,产品口碑汇总。产品特征词-情感块对的挖掘采用的方法是:对于某个情感块,将离其最近的产品特征词作为与之配对的产品特征词。产品特征词-情感块对挖掘后,系统根据不同的产品型号进行分组,对每个产品型号进行口碑汇总。
其他文献
上海和香港,因其特殊的地缘文化和历史渊源历来被史学界和文化界津津乐道并赋予“双城”之名。在两座城市的交流史上,电影曾作为记录社会文化镜像的载体见证了他们各自的发展
我国绘画艺术博大深邃,源远流长,每个时代的画风和画家们的独特风格,有如万舸争流,奔腾不息。提到传统的中国绘画,人们会立刻想到传统四箴之一的毛笔,的确,用毛笔蘸墨作画是
近几年来,民国小学语文教材屡次出现热销甚至脱销的局面,而现行的小学语文教材却饱受弊病。在这样的情况下,很多学者都对民国小学语文教材和当今小学语文教材进行了对比研究,
本文是在“既要保障导弹武器的战斗完好性,又要考虑经济性”的军事需求的背景下,以导弹武器为研究对象,通过研究导弹贮存环境因素和人为因素,综合应用可靠性技术,对导弹费用
自1985年,我国发现首例HIV病毒感染者之后,我国艾滋病的流行已经过传入期、扩散期进入到了快速增长期。近几年,随着我国政府逐年加大对艾滋病防治工作的投入,防治工作初见成
广宗方言隶属于冀鲁官话石家庄邢台片,处于冀鲁官话与中原官话的过渡地带。广宗方言与普通话相比,在声韵调方面都有一些不同的特点,尤其是在声母方面。本文以实地方言调查为
随着测序技术的快速发展,蛋白质序列数量与已测定结构与功能的蛋白质数量的差距越来越大,迫切需要通过理论计算方法实现蛋白质结构功能的预测。目前,许多有效的方法被提出来
旁称代词的成员主要有:人家、人、别人、旁人和他人。每个旁称代词在语用中都不是孤独地存在着,而是都与另外一个人或物构成某种关系,关系属性就是旁称代词最突出的特点。文章
伴随着我国经济的高速发展,科技的不断进步,在跨国企业的发展过程中国际商务活动也越来越多。然而这种形式也对企业管理方式有了新的挑战,跨国企业进行有效的跨文化管理也是
在《巴黎手稿》中,马克思扬弃了抽象自然观,实现了自然观上的生态转向。运用对象性思维,马克思重塑了自然孕育人,自然改变人,人改造自然,人与自然是不可分割、交互作用的有机