数据总结(summary)允许分析人员探索太复杂或数据量太大而无法可视化其细节的数据集。在可视化分析系统中使用总结时,设计人员需要面对大量的设计选择。虽然这些选择会影响所得到的系统的效用,但使用这些总结技术并没有明确的指导原则。在本文中[1],作者将总结用法编入现有系统中,以确定总结可视化设计的关键因素。他们使用定量内容分析系统地调查可视分析系统的示例,并列举这些设计因素在数据总结中的使用。通过这一分析,作者揭示了设计考虑因素,可视化系统中数据总结策略之间的关系,以及不同总结方法如何影响系统支持的分析。作者利用这些结果综合了现实世界中使用总结可视化的常见模式,并强调了这些模式为设计有效系统所提供的开放挑战和机遇。这项工作为总结可视化的设计实践提供了更原则性的理解,并提供对于未充分利用方法的洞察。

图1 总结可视化的流程
可视分析中使用数据总结的一般工作流程如图1所示,首先数据使用聚集,投影等一系列方法进行总结处理,然后处理后数据使用总结可视化进行可视表达,来帮助用户完成数据分析的相关任务。

图2 设计因素
图2为作者利用先前的可视化分类法和设计空间以及自己的观察,总结了四个影响总结可视化的关键因素。如图2所示,分为数据总结方法,目的,任务和数据类型等四个方面。在数据总结方法方面包括聚集(aggregation),采样,过滤和投影。目的分为探索,验证和表达三个类型[2]。分析任务根据SCHULZ等人的总结[3]分为三类,包括数据导航,关系探索和数据特点分析。接下来作者在这些维度上对已有工作进行总结来探索相关因素在影响总结可视化设计上的相互关系。

图3 定量内容分析
首先是对文献的收集,作者收集了EuroVis, InfoVis, SciVis/Vis, 和VAST中2009年到2015年期间的1159篇文章。然后随机采样选取了180篇文章,其中有104篇包括总结可视化技术。最后有两名领域内专家对这些文章按照图3的样式,在之前总结的影响因素上进行评价。在这104篇中,有64篇是包括了大量影响总结可视化的因素,被称为fully-coded。

图4 总结可视化在使用总结方法和目的上的分布

图5 总结可视化常见的设计主题
最终的分析结果如上所示。图4展示的是总结可视化在使用的四种总结方法和三种目的上的分布情况。图5为根据文献在四个设计因素上的分布而总结的不同设计因素的相互影响关系和常见的总结可视化设计主题。例如大部分总结可视化使用了多种总结技术的综合,并且聚集可视化是经常使用的技术。95%(59个中的56个)的探索性的总结可视化允许用户去主动浏览数据集,这也符合Overview first, zoom and filter, then details-on-demand的设计准则。
参考文献:
[1] Alper Sarikaya, Michael Gleicher, and Danielle Albers Szafir. Design Factors for Summary Visualization in Visual Analytics.Computer Graphics Forum, 37(3): 145–156. 2018.
[2] SARAIYA P., NORTH C., LAM V., DUCA K. A.: An insightbased longitudinal study of visual analytics. IEEE Transactions on Visualization and Computer Graphics 12, 6 (2006), 1511–1522.
[3] SCHULZ H. J., NOCKE T., HEITZLER M., SCHUMANN H.: A design space of visualization tasks. IEEE Transactions on Visualization and Computer Graphics 19, 12 (2013), 2366–2375.
评论关闭。