作者存档: Guozheng Li

利用任务以及数据分布评价视觉编码的有效性(Assessing Effects of Task and Data Distribution on the Effectiveness of Visual Encodings)

可视化将数据映射到视觉元素中,将数据的属性映射到元素的视觉通道中,比如位置,长度,颜色等属性。视觉通道的编码效率是非常重要的一个方面,无论是对于用户设计可视化系统,或者自动的可视化设计;对于可视化形式的自动设计,通常需要用户按照编码效率对于视觉通道进行排序,同时按照重要性对于数据属性进行排序。自动可视化设计的准则是按照贪心的准则将属性按照重要性依次赋予到最高效的视觉通道中,但是按照这种方法获得的可视化却无法保证是最优的可视化设计,主要的原因有三点:1. 在不同的视觉通道之间存在相互影响;2. 原始数据的分布会影响用户对于可视化的感知;3. 用户所针对分析任务的不同也会影响视觉通道的效率;本文主要针对目前的视觉通道效率排序所存在的问题,通过评估数据分布以及分析任务的影响对于视觉通道的效率排序进行修正。

继续阅读 »

针对节点链接图中的动态编码方法的设计空间以及初步评估(Animated Edge Textures in Node-Link Diagrams: a Design Space and Initial Evaluation)

节点链接图是可视化中广泛应用的一类可视化方法。节点链接图中的视觉元素主要有节点以及节点之间的链接,目前存在很多的研究工作研究它们的视觉映射方法。本文主要针对的是节点之间的链接的视觉映射方法,在传统的视觉映射方法中,节点之间的链接可以使用颜色,透明度,链接边的粗细,链接边的模式等视觉映射进行编码,然而当前存在的映射数据视觉通道非常有限,在某些情况下,节点链接图中的链接存在的属性值远远超过映射数据的视觉通道,因此本文希望解决的问题是对于节点链接图中链接的视觉映射方法进行拓展,从而支持在链接中映射更多的属性值。

继续阅读 »

Data Illustrator: 使用延迟数据绑定增强矢量设计工具以实现可视化创作(Data Illustrator: Augmenting Vector Design Tools with Lazy Data Binding for Expressive Visualization Authoring)

可视化逐渐成为storytelling以及信息传播的重要的方式。在可视化的发展过程中,在电脑编程制作可视化之前,平面设计师已经可以手动制作可视化。即使在目前存在的可视化中,平面设计师制作的可视化在目前存在的可视化中也占据着很大的比重。相对于电脑制作可视化自底向上的过程,平面设计师制作可视化的过程完全不同,他们首先决定可视化在整体上的外观,然后具体将具体的数据映射到视觉元素中。本文的主要针对的问题是如何辅助平面设计师完成制作可视化,即辅助可视化设计人员用复杂的可视化映射和布局设计器创建高保真数据可视化。针对该问题,本文提出了基于延迟数据绑定的可视化制作框架,并且基于这个框架开发了辅助平面设计师设计可视化的Data Illustrator系统[1]。

继续阅读 »

基于规则,聚类以及选择的多变量事件序列的探索(Exploring Multivariate Event Sequences using Rules, Aggregations, and Selections)

事件序列类型的数据在现实生活中广泛存在,比如通信过程中传递的数据包,医院中病人的看病流程,商场中用户的购买记录等等。在通常情况下,对于事件序列进行分析用到的属性非常有限,包括时间属性以及事件类型,然而对于某些数据分析任务,必须要结合对于事件对象的多变量分析。本文所针对的问题即为多变量的事件序列数据的探索[1], 将正则表达式扩展到事件序列的基础上,提出基于规则,聚类以及选择的多变量事件序列的探索流程,并且在此基础上开发了多变量事件序列的可视分析系统,本文通过对于通话数据以及病人看病流程数据的探索验证了系统的有效性。

继续阅读 »

非线性点图(NonLinear Dot Plot)

柱状图(histogram)和点图(dot plot)是展现数据分布的两种不同的可视化方法。传统的点图使用节点大小一致的节点,直接将数据元素放置到对应的x轴位置处,相对于柱状图的可视化方法,点图是一个更加精确的可视化表现形式,使得其更加容易被用户理解,同时可以支持用户更加简单直观地得到元素的数量。对于大规模的高动态范围数据,在很多情况下用户希望获取数据量较小的数值,但是为了支持用户对于这一范围数据的感知与分析,柱状图支持用户将传统的柱状图转换为非线性的柱状图进行表示。但是对于点图却没有一个合适的可视化方法支持用户的分析,本文的工作提出了一种新的可视化形式,非线性点图,从而支持用户对于大规模的高动态范围的数据进行可视化,更好的感知数据集中数据量较小的异常值。[1]

继续阅读 »

TACO:可视化表格数据的变化(TACO: Visualizing Changes in Tables Over Time)

多变量的表格数据是我们的日常生活中是最为常见的一种数据。对于多个表格数据,他们会在结构和内容方面发生变化,进而产生不同的版本。然而理解表格数据以及探索多变量表格数据的一个重要的任务是对于表格数据进行比较,本文所针对的表格数据的变化包括表格数据的删除,增加,重排序,合并/分离以及表格内容改变等。本文所提出的工具TACO[1],针对表格数据的不同变化设计了新颖的可视化形式,同时根据自顶向下的探索分析方法帮助用户对于大量的表格数据进行探索。

继续阅读 »

借助于直接操作的半自动化SVG编程(Semi-Automated SVG Programming via Direct Manipulation)

所见即所得的直接交互界面是在我们日常生活中非常常见的一种交互方式,比如文本编辑器,Adobe Illustrator均采用了这种思想,用户可以在视图中直接的操作原始的对象 所见即所得的直接操作的界面可以允许更广范围的用户进行使用,在使用的过程中用户可以获得直观的感受,并且交互的反馈。用户可以通过拖拽,移动,改变大小等方式进行操作。尽管直接操作的方法具有非常强大的功能,但是通过直接操作的方式完成代码的编辑是无法完成的。本文的工作提出了Sketch-n-Sketch的工具,帮助用户将代码与直接的操作联系到一起,用户直接操作的同时产生并且更新绘制代码,同时本工作实现绘制过程中的绑定以及抽象分别对应的是实际代码中的组合并且抽象为方法。

针对用户直接操作与代码生成,目前已经存在的工作包括Victor Bret的Drawing Dynamic Visualizations,但是这一类工作的可视化形式是由用户直接操作所得到的,所以用户直接操作无法得到编程的全部能力。当前工作的上一个工作是用户直接编辑代码直接得到可视化元素,用户直接操作可视化元素可以修改代码中的各种参数。本工作的目标是使用尽量少的键盘,更多的使用鼠标完成用户交互的过程。

下图所示为本文的工作中的系统流程图,首先用户绘制可视化形式,可视化形式可以产生代码,用户可以将多个可视化元素之间建立关联,用户可以对于多个绘制元素的方法进行抽象从而得到绘制的函数。相对于之前的系统,在本系统中增加的功能是用户可以直接绘制可视化元素得到绘制可视化元素的代码,

信息可视化中的吸引效应(The Attraction Effect in Information Visualization)

吸引效应是人在两个选择之间的决定会被第三个不相关的选择所影响,这在心理学中是一个被广泛研究的问题。可视化是支持用户的决策的重要方式,比如当我们选择一个要购买的房子或者选择一个要雇佣的雇员,可视化可以帮助用户选择最优的决策方案,然而系统所导致的偏差会产生非常重要的影响。吸引效应所造成的认知偏差,目前仅仅在三个选择中被验证,并且仅仅使用表格,文本,图片的形式,但是其所造成认知偏差同样出现在可视化中。本文为了研究吸引效应在可视化中的存在情况,设计并完成了两个用户调研,在第一个众包的实验中,本文实际上重复了吸引效应的经典实验并且将其拓展到可视化中,并且发现在可视化中具有同样的用户认知偏差;第二个实验主要针对的是吸引效应是否可以被扩展到更大的数据集上,这一类的数据集因为数量的原因难以使用数据表格进行展现。实验结果同样表明,吸引效应所导致的偏差大规模数据集的散点图中同样存在。[1]

继续阅读 »

北京大学2017年校园开放日实验室成果演示

2017年5月20日是北京大学校园开放日,实验室安排了在可视化与可视分析方面的最新成果向公众演示,包括湍流可视化,交通数据、微博数据可视分析,伪基站数据可视分析等科研项目。此次开放日实验室接待的参观者包括来自中小学生及其家长等百余人。实验室成员陈思明,洪帆,张江,赖楚凡,叶唐陟,陈帅,李国政,刘强强,冯璐,张宇,施悦凝等多位同学参与了本次开放日演示工作,向参观者介绍相关的工作,并面对面解答参观者的各种问题。今年校园开放日,实验室增加了HoloLens沉浸式可视化等项目,让参观者亲自体验可视化的乐趣。可视化能将复杂的数据转换为更容易理解的方式传递给受众,本次活动,很好地向公众普及了可视化的最新进展,受到参观者的好评。

继续阅读 »

FaVVEs: 不同抽象层次的多个图标结合的方式可视化数据的不同属性(Faceted Views of Varying Emphasis (FaVVEs): a framework for visualising multi-perspective small multiples)

在可视化中,大部分数据存在多个不同的属性,比如说空间,时间以及描述性的信息等角度,分析人员需要同时研究不同的属性。然而目前存在的并排图标(small multiple)将不同的属性分开比较的方法使得用户难以对于数据进行分析。为了辅助用户同时获得同时分析数据集的不同属性,本文提出了框架FaVVEs,将支持将不同的并排图标叠加在一起进行显示,同时通过动态调整图标的抽象程度,尽可能的避免并排图标的遮挡问题。本文针对图标并排显示以及叠加显示进行了用户测评。

继续阅读 »