【摘 要】
:
潜在狄利克雷分配(LDA)主题模型可用于识别大规模文档集中潜藏的主题信息,但是对于微博短文本的应用效果并不理想。为此,提出一种基于LDA的微博用户模型,将微博基于用户进行
论文部分内容阅读
潜在狄利克雷分配(LDA)主题模型可用于识别大规模文档集中潜藏的主题信息,但是对于微博短文本的应用效果并不理想。为此,提出一种基于LDA的微博用户模型,将微博基于用户进行划分,合并每个用户发布的微博以代表用户,标准的文档-主题-词的三层LDA模型变为用户-主题-词的用户模型,利用该模型进行用户推荐。在真实微博数据集上的实验结果表明,与传统的向量空间模型方法相比,采用该方法进行用户推荐具有更好的效果,在选择合适的主题数情况下,其准确率提高近10%。
其他文献
课外作业和科技活动是小学科学课的延伸,做好课外延伸的教学指导工作,能更好地完成科学课的教学目标。本文通过杭州市两所小学科学课后延伸现状的调查,提出了一些优化策略。
<正>数学与美是融为一体的,美育是素质教育中不可缺少的内容。在小学数学教学中,如何挖掘教材中的审美因素,如何渗透、发挥美育作用,激发学生的学习兴趣,培养学生的审美情趣,
工业设计是提升企业竞争力的重要途径,是企业发展的重要动力。工业设计对提高人们的生活质量,创造更完美的人——自然——社会的环境,有着无法量化的价值。
基于语料库的点互信息(PMI)计算方法依赖于语料库的完善性,基于HowNet的计算方法则依赖于知网相似度计算的准确性。为克服2种方法的局限性,提出一种HowNet和PMI相融合的词语
地下水既是不可或缺的水资源,也是重要的生态与环境支撑要素。保护和合理开发利用地下水资源,是经济社会可持续发展的基础保障条件。矿产开发改变了地下水循环规律、破坏了含
抗战时期,国民政府鉴于西部地区的重要性,在少数民族问题上采取了许多措施,取得了一定的成效。但由于种种原因,国民政府与少数民族之间的矛盾与斗争始终是存在的。
近年来语料库研究在我国的发展呈如火如荼的趋势,带动了大批学者开展研究,其中学习者语料库的发展尤为突出。本文简述了几个国内重要的学习者语料库范例,着重探讨了它们在外
在认知无线电网络中,次用户对主用户产生的干扰会影响主用户通信甚至产生通信中断。针对该问题,提出一种基于泊松分布的干扰模型。该模型考虑次用户对主用户基于信噪比的频谱
柳永少年时期是否随父在扬州生活了六年,究竟是景祐元年还是景祐末进士,究竟是中式还是恩科,至今仍有不同意见,这就是本文要考证探讨的问题。
作为国家通讯社军事新闻宣传的主力军,新华社解放军分社认真贯彻军委总部和新华社党组的部署要求,把这次纪念中国抗战暨世界反法西斯战争胜利70周年活动,尤其是胜利日大阅兵