论文部分内容阅读
对评价文本的意见挖掘旨在提取由对象、特征、评价语和倾向构成的元组.当前方法主要依赖情感词和语言学启发信息获得主观句表达的意见,忽略了语义表达因素,导致意见召回率较低.该文以实际语料为数据基础,寻找意见表达方式的分布规律.文中明确了判别意见、主观句和客观句的准则,并对ChnSentiCorp语料集中12 000个句子进行了标注.统计结果表明,意见特征类别有限且领域差异大;特征呈随机分布,隐性特征占31.8%;客观句形式意见占36%;在表达方式上有5种主观句式、3种客观句式,意见在各句式上分布不平均.论文最后