论文部分内容阅读
[目的/意义]揭示国内在大数据领域研究中的热点主题。[方法/过程]收集CNKI收录的2008—2020年关于大数据的论文,通过LDA主题模型抽取研究主题,并识别热点主题。选取具有代表性的主题,对其再次进行LDA主题聚类,并运用LDAvis对主题进行可视化。[结果/结论] LDA模型能够较为准确地提取大数据领域文献的研究主题,这有利于研究人员了解该领域的发展状态,把握未来的研究方向,探寻新兴主题。