论文部分内容阅读
为了研究主题模型在论文集上的应用,论文实现一个通用框架,该框架允许在文档中明确地包含作者模型,用于回答作者级别和文档级别的查询和预测。论文首先比较吉布斯估计和变分估计在作者主题模型中的优劣,然后实现作者主题模型在论文集上三个的应用:计算词-主题-概率推测词所属主题;根据每年发表的论文类别研究热点话题变化趋势;根据KL散度计算主题分布矩阵上的相似度,进而推断出作者之间的相似性,再为作者推荐相似领域的研究人员。