评价文本中意见分布规律研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:galahad55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对评价文本的意见挖掘旨在提取由对象、特征、评价语和倾向构成的元组.当前方法主要依赖情感词和语言学启发信息获得主观句表达的意见,忽略了语义表达因素,导致意见召回率较低.该文以实际语料为数据基础,寻找意见表达方式的分布规律.文中明确了判别意见、主观句和客观句的准则,并对ChnSentiCorp语料集中12 000个句子进行了标注.统计结果表明,意见特征类别有限且领域差异大;特征呈随机分布,隐性特征占31.8%;客观句形式意见占36%;在表达方式上有5种主观句式、3种客观句式,意见在各句式上分布不平均.论文最后
其他文献
以抚顺市雷锋纪念馆为原型,用三维建模与虚拟现实技术VRML语言建立三维浏览模型.展开雷锋纪念馆建模的分类工作,研究虚拟纪念馆建筑和展厅的建模方法.
该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚