论文部分内容阅读
为加强师生交流,在慕课(MOOC)学习平台讨论区允许学生通过发帖的形式针对课程内容进行讨论。与此同时,学生发帖内容书写的随意性和数据量巨大的特点,给及时回帖带来了挑战。为识别可能存在的无用帖,提出了基于无监督学习的无用帖识别方法。首先对发帖内容和发帖学生行为特征进行融合优化,建立无用帖识别模型;然后采用无监督学习的方法对学生发布的帖子进行识别,以判定该贴是否为无用帖。最后,在真实数据集上的实验证明了方法的有效性。