论文部分内容阅读
主题抽取是意见挖掘的核心任务之一。该文面向维吾尔语评论文本,针对显式主题和隐式主题,提出了一种陈述级的主题抽取方法。该方法采用GLR-Cascaded LDA模型抽取段落级的局部主题、篇章级的全局主题,建立全局—局部主题关系,并将这些关系对应到每个意见陈述中;然后运用Bootstrapping和模式匹配的方法进行显式陈述的主题抽取;最后使用隐式主题推断算法推断隐式陈述的主题。主题抽取的最终目标是为每个意见陈述建立意见陈述—主题四元组。实验结果证明了该方法在主题抽取任务中的有效性。