论文部分内容阅读
近年来,由于移动设备的大范围普及,我们可以方便得利用装有各种传感器的移动设备去采集周围环境中的传感数据,比如湿度,温度,交通状况等。移动群智感知的概念由此而来,它指的是利用用户的智能设备去采集环境数据,上传到统一的数据处理中心,从而协同完成某项感知任务。由于不同的参与者共同完成了数据的采集,导致数据普遍存在不一致性。比如可能受到环境中噪音的影响,不同设备传感器的精度差异或参与者在收集感知信息过程中各种各样的私人行为等等。真值发现就是为了解决这种数据差异性而提出的,它旨在基于收集到的数据对其中隐含的真实值进行估测并对参与者的可信度做出评估。现存的真值发现算法大多基于大量数据聚合后经过分析产生精确的评估结果,也即精确性依赖于海量数据,对于每一个任务,都需保证能采集到大量数据。然而在常见移动群智感知场景中,采集到的数据通常会离散地分布在一个较大的感知区域中,某一些任务或许只能收集到非常少的数据。在这种情况下,传统的真值发现算法因为缺少足够的数据支持,将无法提供准确的评估。为了解决这个挑战,本文提出了一个有效的真值发现算法,名为Holmes。它利用了待观测实体之间的空间关联性,将参与者的提供的感知信息重用于周围的多个任务,从而解决了数据稀疏问题。我们还考虑了长尾效应,即大部分参与者都只会提供少量的感知信息,而一个参与者数据量越多,我们对他可靠性的评估才会越准确。因此我们提出了Holmes-LT对参与者可靠性评估进行了更为准确的控制。由于在流数据场景下,不断迭代求值的方式效率低下,因此我们提出了Holmes-OL,能够以较低的时间复杂度实现较准确的真值估计。通过全面的仿真实验和真实场景实验,我们对所提出算法的性能进行了评估,结果表明我们的算法在准确度上显著超越了现有的其他真值发现算法,并且扩展性强,在效率方面也有较大改善。