电子商务中垃圾评论检测的特征提取方法

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:hnzzzc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】针对电子商务中产品评论存在较多垃圾评论的问题,提出新的特征提取方法,提高垃圾评论的识别率。【方法】根据量化评价的思想,使用词性路径匹配模板检测评论中的评价句,并在分词中加入自定义评价词词典,提高评价句的识别率。利用评价句的数量能够很好地区分与产品无关的评论或垃圾评论的优点,结合评论的主题词、情感倾向、文本结构等,有针对性地提取相应的特征。【结果】实验结果显示,利用该特征识别垃圾评论的准确率为97.96%、F值为88.48%。【局限】该方法主要用于中文垃圾评论的识别,不适用于英文产品评论。【结论】所提取的特征能够高效准确地识别垃圾评论,亦可用于正常评论的有用性量化评估及排序,有广泛的应用价值。
其他文献
:《觉醒》是 19世纪末美国女作家凯特·肖邦的一部颇具争议的小说。以神话原型批评理论解读这部作品 ,可以发现 ,其中女主人公形象是“众生之母”的夏娃和希腊女神阿佛洛狄忒
【目的】对在线产品评论垃圾识别的研究工作进行梳理,总结研究现状,明确发展方向。【文献范围】从CNKI及Google Scholar中以"评论垃圾"、"review/opinion spam"等为检索词筛
目的探讨围产期护理干预措施对妊娠合并糖尿病患者在临床上的影响。方法选取32例妊娠合并糖尿病患者为研究对象,随机分组,对照组行常规护理干预。观察组给予围产期护理干预。
冰凌是冬季寒冷地区河流上普遍存在的一种水文现象。这些地区河流冬季常形成冰盖、冰塞或冰坝,目前在冰期水文分析中的难点是开河水位的预测以及稳封期冰厚的计算。一般开河水
本文采用问卷调查、数理统计、文献资料调研、专家咨询访谈等方法,对肇庆市7所中学的中学生课外体育活动的态度、锻炼时间次数、参与动机、活动项目以及影响学生课外体育活动
<正>教学这种特定情景中的人际交往由教师和学生的双边活动构成,师生之间存在着两条交织在一起的信息交流回路——知识信息交流回路和情感信息交流回路,二者相互影响,从不同
目的探究慢性肺源性心脏病的临床治疗效果。方法随机抽取慢性肺源性心脏病患者52例,按入院先后的顺序平均分为观察组与对照组。观察组进行西医治疗,对照组患者治疗方法为中医
形式理性法是指具有高度预测性的法律规范体系,可以用于任何调整目的。官僚型的政治统治类型、主体权利不断扩大、三权分立及相互制约、法律职业共同体的形成以及法学思维的
人民调解委员会对民间纠纷的调解是我国处理人民内部矛盾的一种独特方式。我国现行的人民调解协议在法律上尚不具备权威性和有效性。为充分发挥人民调解的特有作用,我国法律应