论文部分内容阅读
在互联网的开放环境下,众包平台中的飞速发展带来了信息过载问题,使工人面临着任务选择的难题。由于任务搜索难以满足工人的个性化需求,任务推荐作为解决信息过载的有效方法,得到了更广泛的讨论与研究。因此,基于传统领域推荐方法的研究和对众包及工人行为特征的分析,本研究提出一种综合考虑工人兴趣和能力的任务推荐方法,并补充方法分别实现工人冷启动和任务冷启动下的推荐。首先,基于协同过滤推荐思想,考虑工人兴趣和能力的任务推荐方法第一步需要构建工人模型。基于众包工人行为特征的分析,首先通过TF-IDF技术构建考虑兴趣偏好的工人模型,然后将基于胜任力理论分析构建的工人KSAO能力集合融入到模型中,构建能够同时描述兴趣和能力的工人模型。然后,在工人模型基础上,进行综合相似度的计算以及最终产生推荐。利用余弦相似性、Jaccard相似性和改进的余弦相似性公式,并引入计可学习的权重系数α_i、β_i和融合系数θ,计算工人间融合兴趣和能力的综合相似度,依此来选取工人的近邻集并最终生成top-N任务推荐列表。然后,基于上述方法不能解决的新工人及新任务的推荐问题,提出冷启动条件下的任务推荐优化。针对工人冷启动,结合新工人在众包平台中的注册信息,提出基于工人档案信息的推荐方法;针对任务冷启动,结合基于内容的推荐算法思想,利用LDA主题模型挖掘新老任务的内容主题,再综合任务的类型,提出基于任务内容和类型的推荐方法。最后,利用猪八戒网采集的数据进行实验,结果表明本研究提出方法的有效性,并通过对比实验证实,相比于传统协同过滤推荐方法以及传统冷启动推荐方法,本研究的方法取得的推荐效果更佳。本研究在理论上从推荐视角丰富了众包任务选择的研究,同时对于众包中解决信息过载问题、增进用户个性化体验等方面具有一定的现实意义。