论文部分内容阅读
意见挖掘中,产品特征层次的学习是其中重要的环节之一。为了更准确的学习产品特征层次,提出了一种从非规则与规则意见文本语料中对产品特征层次进行学习的算法。该算法能同时对包含专业描述的规则语料以及人为指定主题的非规则语料进行学习。利用文本特征词识别技术去除与主题相关度较差的词汇,并使用相对熵和语法结构分析方法从语料中产生出层次关系。实验结果表明,该算法能够较好地学习特征层次。