论文部分内容阅读
现实生活中,人工智能、大数据等领域的快速发展给我们的生活带来极大的便利,机器学习、数据清洗等领域的很多数据需要通过人工进行标注,众包技术提供了一种将需要人工处理的问题发布到互联网上,通过互联网上的大众智慧解决问题的新方式。在众包技术中,质量、经济成本、时间成本是三个主要的研究目标。过高的经济成本将给任务发布者带来负担,时间成本的增加将使任务不能在规定时间内完成。在众包任务分配的研究中,研究者往往专注于提升任务质量,忽略了其他两个目标的控制。现有关于众包多目标控制的研究较少,而已有的多目标控制的研究往往局限于表格连接等具体任务类型,没有一种具有通用性的多目标控制方式。通过对众包中的三个研究目标相互作用关系的研究,综合考虑三个目标的制约关系,本文将多目标控制与任务分配相结合,提出了两种具有普适性的多目标控制模型;考虑到众包技术中现有的答案决策多基于贝叶斯决策算法,而任务分配是在未收到工人回答的情况下进行,需要对任务答案可信度进行预测,本文提出了一种适用于任务分配阶段的基于贝叶斯的任务答案可信度预测算法;同时,本文还提出了符合两种多目标控制模型的多种任务分配算法,并进行了算法有效性和效率的评估。众包技术中,工人激励是产生经济成本的根本原因。已有的工人激励模型多基于任务搜索模式,本文提出了一种适用于任务分配模式的工人激励模型,并对于已有的任务分配算法进行优化;本文根据任务分配模式下任务的生命周期,分析并总结了任务分配中时间成本产生的原因,并提出了控制时间成本的有效方式。基于上述研究,本文设计并实现CrowdIQ众包平台任务分配系统,并对CrowdIQ中的多目标控制进行分析与总结。