分类存档: 论文报告

散点图:任务,数据和设计(Scatterplots: Tasks, Data, and Designs)

传统的散点图随着数据复杂性和数据量的增长逐渐无法胜任可视分析的任务,因此,对传统散点图的修改和扩展设计层出不穷。针对具体分析目标,研究人员如何设计和选择合适的散点图也面临着更多的选择和挑战。这篇论文[1]旨在帮助设计人员针对散点图可视化形式做出合适的设计。通过调研相关文献,论文总结出针对散点图的分析任务、数据特征、设计方案等,通过结合这三者,提出存在的问题与挑战,并给出好的散点图设计示例。

继续阅读 »

当大卫遇上歌利亚:在数据可视化与探索中将智能手表与大屏幕结合(When David Meets Goliath: Combining Smartwatches with a Large Vertical Display for Visual Data Exploration)

随着大屏幕技术的发展和普及,其在展示、交互、合作方面的优秀性能使其更广泛地应用于可视化与数据探索。大屏幕的高分辨率和充足的显示空间可以支持展示更多信息,提供了多人协同分析的空间,并可以组合多种交互方式使探索过程更加自然。然而使用大屏幕进行可视分析仍存在很多挑战,诸如工具和菜单栏遮挡视图、用户无法触及屏幕较远位置、交互距离过长引起疲劳、多用户合作时面临冲突等问题。针对这些挑战,跨设备交互——使用个人设备(如手机、iPad、智能手表等)与大屏幕结合分析是一种常见的解决办法。相比于其他设备,智能手表具有轻便、操作便捷、解放双手、注意力转换少(部分操作无需注视手表)的优点,但相关研究中缺少将智能手表与大屏幕可视分析系统结合的工作,因此这篇文章[1]专注于解决这个问题,使智能手表作为存储和发送数据的存储器、提供额外视图和交互的中介和远程定位的控制器,提供了一套将大屏幕与智能手表结合的设计理论和系统,如图1,不仅能保障在多用户合作过程中个人探索的准确性,同时能降低个人操作对屏幕整体的影响,最后他们通过用户体验的结果验证了该系统的有效性。

继续阅读 »

使用信息论故事版选择大规模时变体数据集中的关键时间步 (Key Time Steps Selection for Large-Scale Time-Varying Volume Datasets Using an Information-Theoretic Storyboard)

在科学可视化中,随着数据规模的不断增大,时变数据往往包含了大量的时间步。由于内存和I/O带宽的限制,对所有这些时间步进行可视化经常比较困难。实际上,这些数据在连续的时间步的变化很可能非常小,其包含的信息也并不重要。解决这一问题的一个可能的方法是从中选取具有最显著特征的几个关键时间步进行可视化。但是,数据中重要特征的随时间的变化可能包含复杂的模式,并且会以未知的频率发生。如何选择关键时间步也成为了一个挑战。因此,今年EuroVis的一篇文章[1]提出了一种新颖的方法,可以使用动态规划来提取出数据中的关键的时间步。

继续阅读 »

利用任务以及数据分布评价视觉编码的有效性(Assessing Effects of Task and Data Distribution on the Effectiveness of Visual Encodings)

可视化将数据映射到视觉元素中,将数据的属性映射到元素的视觉通道中,比如位置,长度,颜色等属性。视觉通道的编码效率是非常重要的一个方面,无论是对于用户设计可视化系统,或者自动的可视化设计;对于可视化形式的自动设计,通常需要用户按照编码效率对于视觉通道进行排序,同时按照重要性对于数据属性进行排序。自动可视化设计的准则是按照贪心的准则将属性按照重要性依次赋予到最高效的视觉通道中,但是按照这种方法获得的可视化却无法保证是最优的可视化设计,主要的原因有三点:1. 在不同的视觉通道之间存在相互影响;2. 原始数据的分布会影响用户对于可视化的感知;3. 用户所针对分析任务的不同也会影响视觉通道的效率;本文主要针对目前的视觉通道效率排序所存在的问题,通过评估数据分布以及分析任务的影响对于视觉通道的效率排序进行修正。

继续阅读 »

可视分析中总结可视化的设计因素(Design Factors for Summary Visualization in Visual Analytics)

数据总结(summary)允许分析人员探索太复杂或数据量太大而无法可视化其细节的数据集。在可视化分析系统中使用总结时,设计人员需要面对大量的设计选择。虽然这些选择会影响所得到的系统的效用,但使用这些总结技术并没有明确的指导原则。在本文中[1],作者将总结用法编入现有系统中,以确定总结可视化设计的关键因素。他们使用定量内容分析系统地调查可视分析系统的示例,并列举这些设计因素在数据总结中的使用。通过这一分析,作者揭示了设计考虑因素,可视化系统中数据总结策略之间的关系,以及不同总结方法如何影响系统支持的分析。作者利用这些结果综合了现实世界中使用总结可视化的常见模式,并强调了这些模式为设计有效系统所提供的开放挑战和机遇。这项工作为总结可视化的设计实践提供了更原则性的理解,并提供对于未充分利用方法的洞察。

继续阅读 »

大规模可视化API用法示例(Visualizing API Usage Examples at Scale)

学习如何正确有效地使用现有的API是软件开发中的一个常见任务,也是一个核心挑战,因为库和API的数量和复杂性正在增加。程序员经常在Q&A论坛中搜索在线代码示例,阅读教程和博客帖子,学习如何使用给定的API。然而,经常对于大量相关的代码示例,用户很难理解它们之间的共性和差异,并深入到具体的细节。我们介绍了一个交互式可视化探索从开源库挖掘的大量代码示例。该可视化通过一个合成代码框架总结了数百个代码示例,其中包含规范调用语句和包含API调用结构的统计分布。

继续阅读 »

使用一些比较任务比较不同类型的柱状图( What’s the Difference?: Evaluating Variants of Multi-Series Bar Charts for Visual Comparison Tasks )

越来越常见的数据分析方法涉及到使用信息仪表板来直观比较变化数据。 但是对于不同布局约束与不同层次的可视化形式的视觉比较是一项具有挑战性的任务。 在在本文中,我们评估了条形图的不同变体,我们使用常见的在仪表板中使用的流行类图表。 我们使用了一个在线实验(N = 74)进行评估四个选择设计:1)分组条形图,2)分组条形图差异叠加,3)条形图与差异叠加,和4)差异图表。 结果显示有带有叠加层的差异图表适合更广泛的比较任务。 最后,我们讨论我们调查结果的含义,重点是支持仪表板中的视觉比较[1]。

继续阅读 »

SetCoLa: 高层次限制的图布局语言(High-Level Constraints for Graph Layout)

有效的图布局可以帮助人们分析网络的拓扑结构,已有的许多工具,比如Gephi,D3都能够完成图布局的任务。计算图布局的时候,通常只考虑节点的拓扑信息,而对于特定领域的图,比如生物信息网络,布局时候还要考虑节点的属性信息。针对这样的特定领域(Domain-specific)图数据,虽然已有特定的布局方法,但是这些方法只能限定在该领域里使用,而不具有推广性。使用一般的布局方式,比如力导向布局来处理这些图数据,为了反映网络的特定结构,还需要对布局后的结果进一步调整,耗时耗力。本文[1]提出了一种更高层次的布局语言SetCoLa,可以有效结合结合图数据本身特点,对于布局的结构进行限制。

继续阅读 »

在散点矩阵中使用动画来减轻重叠(Using Animation to Alleviate Overdraw in Multiclass Scatterplot Matrices)

散点矩阵(SPLOM)是可视化中渲染多变量多类别数据的常用技术。然而,多类别 SPLOMs 有透支(重叠点)的问题,大多数现有技术只关注于单个散布图与单一类的透支减轻问题。本文利用闪烁点动画来达到减轻多类别散点矩阵中的透支问题。在69个参与者的用户研究中,我们发现用户不仅在使用动画SPLAMs识别密集区域方面表现更好,而且还发现他们更容易解释,并且优于静态散点矩阵。这些结果为今后减轻多类别SPLOM透支的工作开辟了新的方向,并为应用动画减轻其他可视化形式中的透支提供了见解。

继续阅读 »

ConcaveCubes: 支持基于聚类的大规模地理数据可视化 (ConcaveCubes: Supporting Cluster-based Geographical Visualization in Large Data Scale)

城市数据越来越容易获取,且规模不断扩大。现有的信息可视化方法在处理大规模数据时,需要占用大量的存储空间,交互时间过长,并且会由于渲染过多的图元而加重用户的认知负担。

继续阅读 »