景区评论词频统计算法研究

来源 :轻工学报 | 被引量 : 0次 | 上传用户:jiaosai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对人们在出游前查看景区网络评价信息难以得到对该景区之整体评价的问题,提出了一种适用于海量数据的词频统计算法TF-CT.该算法采用余弦相似性算法对海量的文本数据进行词性分类,将具有相同表达态度的数据归为一类;采用TextRank算法对各类别中的一条数据进行关键词语提取;采用改进的TFIDF算法对提取的关键词进行词频统计,获取文本数据的表达态度.实验结果表明,与TFIDF算法相比,TF-CT算法在结果准确度和时间复杂度上具有更大的优势.
其他文献
为了丰富对安阳地区赤霞珠葡萄果表酵母菌组成的认识,从采自安阳地区的赤霞珠葡萄果表进行富集、分离、纯化得到70株酵母菌,通过传统的形态学分类与现代分子生物学鉴定,这70
近年来,农村一些地方农田弃耕抛荒现象日趋严重,尽管对此采取了一些遏制性措施,但收效不明显,并且呈现继续发展的趋势,成为制约农业现代化进程的一个突出问题。通过分析农民弃耕抛
对经H2SO4改性的凹凸棒土作为固体酸催化剂时,其在葡萄糖脱水制备生物基平台化合物5-羟甲基糠醛(HMF)过程中的催化性能进行研究,结果表明:凹凸棒土经不同浓度H2SO4改性后,Bro
以鲫鱼蛋白-D-木糖MRPs·OH清除率、总还原能力和吸光度为考察指标,研究了不同类型和浓度的金属离子对MRPs抗氧化活性的影响.结果表明,Na+和K+对MRPs的·OH清除率和总