论文部分内容阅读
Web2.0时代,网络出现了大量产品评论,这些评论不仅给用户消费产品带来一定的导向作用,而且对厂家生产产品起到一定的反馈作用,如何从大量复杂评论数据中抽取有效信息并构建评价知识库显得尤为重要。通过将概念格、模糊集、关联规则在理论上进行互补融合,定义了汽车评价知识的相关基础概念,在此基础上,提出了一套汽车评价知识库的构建方法和应用机制。主要研究内容如下:(1)基于模糊概念格的汽车评价相关概念将概念格与模糊集、关联规则挖掘进行融合应用于汽车评价中,定义汽车评价知识库的基础概念和相关知识。在概念格中引入模糊集,并与汽车评价知识相融合,提出了适合于汽车评价的模糊概念格模型;将模糊概念格引入关联规则,对规则的挖掘过程和指标重新定义,建立以模糊概念格表示的从中可以提取模糊关联规则的汽车评价知识库。(2)基于模糊概念格的汽车评价知识库构建针对包含丰富评价信息的汽车评论数据,为了有效挖掘和组织这些知识,提出基于模糊概念格的汽车评价知识库构建方法。依据面向观点挖掘的汽车领域本体从原始语料中抽取评价搭配的五元组构建模糊形式背景。在此基础上,利用属性隶属度形成模糊概念格,用于构建面向汽车评价的知识库。利用新浪汽车上价格区间在5-20万之间的374个车系的37646条评论,通过对置信阈值T设置,构建汽车评价知识库。最后,对知识库中数据进行相关分析。(3)基于模糊关联规则的汽车评价知识构建及应用利用模糊概念格构建的汽车评价知识库可以通过概念以及格结构刻画知识与知识间的层次关系。本文运用模糊关联规则格的方法对基于模糊概念格表示的知识库进行改进,将提取规则过程中的部分参数进行重新定义,用于构建汽车评价的关联知识,以补充和完善由模糊概念和格结构表示的知识库。在此基础上,依据模糊关联规则对汽车缺省的评价信息进行推理。