论文部分内容阅读
互联网的普及带动了传统餐饮业向电子商务行业的转变,越来越多的消费者选择在网络上订餐,由此产生的在线评论也越来越多。对消费者客户评论进行分析能够解决餐饮商家和消费者信息不对称的问题,让商家更了解消费者,消费者也能个性化选择。当前市面上对评论处理的平台不多,有的对评价的处理不是很细致。例如美团,有对评论中的提到的主题进行计数,按用户标记的标签进行文本分类。结合某平台上餐饮商家的结构化数据和非结构化数据的分析,开发出基于文本挖掘的餐饮商家评价系统,研究贡献包括以下四个方面。第一,以提升速度为目的的商家评价数据预处理。将餐饮网站上的商家评论作为研究数据,针对网络评论数据量巨大、数据维度多的特征对数据进行分类存储,设计出根据城市和菜品类别的主题模型。这种存储方式较原始的存储来说,分词、情感分析速度有大大的提高,并且对系统功能的数据查询效率有所提升。第二,以获取准确全面商家主题为目标的主题提取。通过特征降维处理后的数据,针对不同类别主题词的不一致,用不同类别的商家评论数据进行LDA主题提取,再根据词频和共现度筛选出餐饮的一级主题词;为了避免中文的同义词表达和主题词的全面性,利用Word2vec相似词提取得到二级主题词。这样的提取主题的方法包含了所有餐饮的共性主题,保证了主题词的全面性。第三,为了准确评价商家为目的设计的情感分析。针对一个句子中的多个主题识别,系统利用依存句法分析对评论文本进行分析,提取出句子中的主题-情感关系对。再结合HowNet情感词典对主题对应的情感进行计算,设计出每个主题评分和商家综合评分的计算方法。计算得到的评分与美团网上的评分进行对比,计算结果保持一致,证明了商家评价的准确性。最后,该系统采用B/S架构,运用Web相关技术进行餐饮商家评价系统的开发。根据评分结果设计出商家查询、商家对比、满意度分析的功能,满足当前用户和商家的需求。