作者存档: Qiangqiang Liu

使用一些比较任务比较不同类型的柱状图( What’s the Difference?: Evaluating Variants of Multi-Series Bar Charts for Visual Comparison Tasks )

越来越常见的数据分析方法涉及到使用信息仪表板来直观比较变化数据。 但是对于不同布局约束与不同层次的可视化形式的视觉比较是一项具有挑战性的任务。 在在本文中,我们评估了条形图的不同变体,我们使用常见的在仪表板中使用的流行类图表。 我们使用了一个在线实验(N = 74)进行评估四个选择设计:1)分组条形图,2)分组条形图差异叠加,3)条形图与差异叠加,和4)差异图表。 结果显示有带有叠加层的差异图表适合更广泛的比较任务。 最后,我们讨论我们调查结果的含义,重点是支持仪表板中的视觉比较[1]。

继续阅读 »

将基本的D3图标转化为可重用的风格模板(Converting Basic D3 Charts into Reusable Style Templates)

这篇工作介绍一种将基本D3图表转换为可重用样式模板的技术。给定一个新的数据源,这篇工作应用样式模板来生成一个描述新数据的图表。为了构造样式模板,这篇工作首先解构D3图表中的:数据,标记和数据的映射。然后,这篇工作对解构出的映射的做感知有效性进行排序。要将生成的样式模板应用于新的数据源这篇工作们首先要获取每个新数据字段的重要性等级。然后,这篇工作调整模板映射以通过将最重要的数据字段与最感知有效的映射进行匹配来描述源数据。这篇工作展示了样式模板如何以数据表格或其他D3图表的形式应用于源数据。虽然这篇工作的实现侧重于为基本图表类型(例如条形图,折线图,点图,散点图等)生成模板,但这些是当前最常用的图表类型。用户可以很容易地在Web上找到这些基本的D3图表,将它们变成模板,并立即看到他们自己的数据在模板的视觉样式(例如颜色,形状,字体等)中的外观。这篇工作通过将多样化的样式模板应用到各种源数据集来证明这篇工作方法的有效性[3]。

继续阅读 »

交互式的从表格中提取数据(ChartSense: Interactive Data Extraction from Chart Images)

表格数据广泛存在于各种类型的电子文档中,比如网页,论文,幻灯片等等。但是表格中存在的数据我们是无法获取的。所以从表格数据从提取原始的数据变得极为重要。提取出数据后,我们可以对数据做进一步的分析,或者改进原有的表格形式。

继续阅读 »

从位图可视化中提取和更改颜色映射(Extracting and Retargeting Color Mappings from Bitmap Images of Visualizations )

可视化设计人员经常使用颜色来编码数值型和类别型的数据。然而,之前的可视化经常违反感知色彩设计原则,而且可能是位图图像。在这项工作中,我们提供了一种从位图可视化图像中半自动提取颜色编码的方法。给定图像和图例位置,我们将图例分类为描述离散或连续颜色编码,识别所使用的颜色,并使用OCR方法提取图例文本。然后我们结合这些信息来重新做颜色映射。用户还可以使用注释界面来纠正解释错误。我们使用从科学论文中提取的图像语料库评估我们的技术,并证明各种图表类型的颜色映射的准确率。此外,我们介绍了我们的方法的两个应用:自动重新着色以提高知觉效果,交互式操作以改善静态可视化的可读性 [1]。

继续阅读 »

将视频和移动数据结合来增强体育运动分析(Bring it to the Pitch: Combining Video and Movement Data to Enhance Team Sport Analysis)

对体育比赛进行分析,可以观察球员或球队的战略和战术行为。当前的分析工作流通常基于人工观看比赛视频分析。但是观看视频通常是一个耗时的过程,分析人员需要记住和注释场景。这项工作将球队视频与轨迹数据的抽象可视化相结合来帮组我们理解 [1]。

继续阅读 »

延迟不确定性和其对火车旅行规划的影响的可视化(Visualization of Delay Uncertainty and its Impact on Train Trip Planning: A Design Study)

火车延误的不确定性对火车旅行具有很大的影响。延误可能导致转车时错过连接火车,或到达目的地比预约的时间要晚。面对这种不确定性,旅行者希望预先知道火车可能的延迟。目前,火车旅行规划是基于两站之间的预定的时间。虽然有几种可视化方法可以显示时间不确定性,但没有专门的视觉设计支持行程规划。对于这些问题,我们提出了一个评估视觉设计,延迟火车旅行规划与延迟不确定性可视分析系统。它列出了预定的火车线路连接,预期的火车延误以及它们对到达时间的影响以及错过转车的可能性[1]。

继续阅读 »

从事件序列中提取和可视化子模式(CoreFlow: Extracting and Visualizing Branching Patterns from Event Sequences)

时间事件序列,如应用程序日志数据和Web访问者点击流,有助我们理解用户行为和做相应的决策。事件序列数据的可视化和分析是一个备受关注的研究领域,但仍然是一个尚未解决的问题。序列数据集可以包含数千个或多个不同的序列。这些序列中的每一个都可能由数百个有序事件组成。独特事件的数量可以是成百上千。巨大的数量和复杂性使得传统的可视化技术不适用。即使我们将事件聚合为较少的类别,仍然很难提供一个很好的概览。

继续阅读 »

基于等价目的地的位置相关路网概括(Location-dependent generalization of road networks based on equivalent destinations)

位于道路网中某个顶点的用户想要到达某个地方。事实上用户的确切目的地可能与计划路径关系不大,因为确切的目的地并不会影响我们的初始方向。我们到达目的地有很多的条路径,其实绝大部分路径是重合的。许多目的地对于用户来说是等效的。我们提出了一种自动找到这些等价目的地的方法,并通过所得到的这些集群来简化路网。我们将这个问题模型化为有根,边缘加权的树中的聚类问题。我们计算出的聚类网络提供了一个常数等价度因子。通过我们这种方法可以简化节点和边,使得我们寻找最短路径的时候能够不被整个地图所干扰,能够高效的找出最短路径[1]。

继续阅读 »

在长的时间序列上使用形状语法对手绘图案进行高效匹配(Shape Grammar Extraction for Efficient Query-by-Sketch Pattern Matching in Long Time Series)

数千甚至数百万的时间步的长的时间序列,在许多应用领域是常见的,但是我们想要交互性的探索这些时间序列及其困难。通常我们的分析任务数据是识别特定模式,但是找到有趣的模式是非常复杂的和需要大量的计算。我们提出一种有效的方法来探索用户绘制的模式,结合领域专家的知识,通过形状语法的方法来探索时间序列数据。形状语法是从时间序列中提取我们定义的基本形状组合。我们使用比率值来表示这些基本形状,使用对比值进行模式匹配。我们提出的模式匹配方法是基于幅度,尺度和翻译不变性。在图1中,将感兴趣的草图模式与时间序列数据匹配。 我们能够基于梯度比对非常大的时间序列进行实时的模式匹配[1]。

继续阅读 »

从可视化看美国大选

2016年的美国大选的结果已经尘埃落地。在这次美国大选过程中,各大主流媒体都卯足了力量展开数据新闻报道。比起纯文字的枯燥无味,数据新闻化繁为简,趣味形象,在大选结果的展示上更是具有天然的优势。不同的媒体在在数据呈现层面都带有自己的特色,同时社会化媒体的兴盛和各种流量入口的聚合也在影响数据新闻的推广。比如使用Google搜索“美国大选”,会直接显示实时的信息图表。本文收集了大选报道的一些案例,逐一和大家分享。

继续阅读 »