论文部分内容阅读
本文主要研究了基于搜狗引擎用户浏览数据下的用户画像构建,我们具体地、标签化地、有针对性地描述了用户特征,并以此作为市场分析、商业决策、精准营销的依据。用户画像技术可以帮助搜索引擎更有针对性的服务用户。本文主要工作:一是对用户搜索数据集进行预处理,分词上我们选用了Jieba分词工具;二是特征词的选取采用了基于TF-IDF的向量空间模型;三是使用Word2vec将特征词转变为词向量;最后使用不同的分类器构建用户画像,我们在这里使用了Stacking模型。