标签存档: 众包

在众包数据分析中识别信息冗余和检验信息来源 (Identifying Redundancy and Exposing Provenance in Crowdsourced Data Analysis)

在很多分析工作中,分析师们需要针对图表进行分析任务,例如分析某个城市就业率曲线的增减。也许分析少数几张图表并不是什么难事,但假若我们要分析上百个甚至上千个城市的就业率曲线时,这便成为一个任务量巨大的工作。分析师们可以利用众包完成分析任务,例如在 Amazon Mechanical Turk 上付点小钱让工人们 (crowd workers) 每人完成一两个小任务,聚集起大家的分析结果就可以完成整个分析任务。但是,通过众包方式获得的结果也存在一些问题:1) 工人们提供的信息中含有冗余信息,这增加了分析师们的工作量 2) 由于工人的知识水平不同,他们的答案准确性也有差别。这篇论文工作的目标是帮助分析师们再一次用众包的方法来分析由众包提供的答案。

继续阅读 »