VDQA:轨迹数据质量可视分析

简介

在轨迹数据分析中,数据清理通常是一项艰巨的任务,它需要专业知识和花费很大的努力。在本文中,我们提出了一种可视分析方法,以帮助分析人员更有效地定义和检测原始轨迹数据中的数据质量问题。该方法采用半自动检测策略,结合了视觉探索和自动分类的优点。具体而言,我们通过将自动编码技术与轨迹属性相结合,将轨迹数据变换为向量空间。我们提供了一个名为VDQA的可视分析系统,用于支持有关时空和向量化特征的轨迹分析。通过使用降维,用户可以快速识别向量空间中存在质量问题的数据。利用所识别的异常,我们训练分类模型以有效地揭露具有类似问题的更多数据。用户可以进一步改进模型,直到获得满意的结果。我们已将此方法应用于多个真实世界的轨迹数据集。结果证明我们的方法确实帮助用户以更有效的方式识别质量问题。

引用

图片

VDQA的流程图:在通过滑动窗口将轨迹划分为等采样点子轨迹之后,我们融合了LSTM自动编码器提取的特征和手动定义的特征来表征它们。然后,VDQA为数据质量标注提供交互式的空间、时间和特征的过滤。接下来,训练逐步更新的分类模型并检测具有类似数据质量问题的数据。通过排除清洁的子轨迹来更新轨迹数据集。

VDQA的界面:(a)具有不同类型质量问题子轨迹的时空概述;(b)轨迹特征的高维投影图,以支持有问题子轨迹的探索和识别;(c)过滤后的子轨迹列表;(d)Small multiple视图,它推荐与所选择的子轨迹类似的若干子轨迹;(e)所选子轨迹采样点上的详细特征分布;(f)具有不同质量问题的轨迹列表;(g)分类器结果的评估视图。