作者存档: Guozheng Li

基于规则,聚类以及选择的多变量事件序列的探索(Exploring Multivariate Event Sequences using Rules, Aggregations, and Selections)

事件序列类型的数据在现实生活中广泛存在,比如通信过程中传递的数据包,医院中病人的看病流程,商场中用户的购买记录等等。在通常情况下,对于事件序列进行分析用到的属性非常有限,包括时间属性以及事件类型,然而对于某些数据分析任务,必须要结合对于事件对象的多变量分析。本文所针对的问题即为多变量的事件序列数据的探索[1], 将正则表达式扩展到事件序列的基础上,提出基于规则,聚类以及选择的多变量事件序列的探索流程,并且在此基础上开发了多变量事件序列的可视分析系统,本文通过对于通话数据以及病人看病流程数据的探索验证了系统的有效性。

继续阅读 »

非线性点图(NonLinear Dot Plot)

柱状图(histogram)和点图(dot plot)是展现数据分布的两种不同的可视化方法。传统的点图使用节点大小一致的节点,直接将数据元素放置到对应的x轴位置处,相对于柱状图的可视化方法,点图是一个更加精确的可视化表现形式,使得其更加容易被用户理解,同时可以支持用户更加简单直观地得到元素的数量。对于大规模的高动态范围数据,在很多情况下用户希望获取数据量较小的数值,但是为了支持用户对于这一范围数据的感知与分析,柱状图支持用户将传统的柱状图转换为非线性的柱状图进行表示。但是对于点图却没有一个合适的可视化方法支持用户的分析,本文的工作提出了一种新的可视化形式,非线性点图,从而支持用户对于大规模的高动态范围的数据进行可视化,更好的感知数据集中数据量较小的异常值。[1]

继续阅读 »

TACO:可视化表格数据的变化(TACO: Visualizing Changes in Tables Over Time)

多变量的表格数据是我们的日常生活中是最为常见的一种数据。对于多个表格数据,他们会在结构和内容方面发生变化,进而产生不同的版本。然而理解表格数据以及探索多变量表格数据的一个重要的任务是对于表格数据进行比较,本文所针对的表格数据的变化包括表格数据的删除,增加,重排序,合并/分离以及表格内容改变等。本文所提出的工具TACO[1],针对表格数据的不同变化设计了新颖的可视化形式,同时根据自顶向下的探索分析方法帮助用户对于大量的表格数据进行探索。

继续阅读 »

借助于直接操作的半自动化SVG编程(Semi-Automated SVG Programming via Direct Manipulation)

所见即所得的直接交互界面是在我们日常生活中非常常见的一种交互方式,比如文本编辑器,Adobe Illustrator均采用了这种思想,用户可以在视图中直接的操作原始的对象 所见即所得的直接操作的界面可以允许更广范围的用户进行使用,在使用的过程中用户可以获得直观的感受,并且交互的反馈。用户可以通过拖拽,移动,改变大小等方式进行操作。尽管直接操作的方法具有非常强大的功能,但是通过直接操作的方式完成代码的编辑是无法完成的。本文的工作提出了Sketch-n-Sketch的工具,帮助用户将代码与直接的操作联系到一起,用户直接操作的同时产生并且更新绘制代码,同时本工作实现绘制过程中的绑定以及抽象分别对应的是实际代码中的组合并且抽象为方法。

针对用户直接操作与代码生成,目前已经存在的工作包括Victor Bret的Drawing Dynamic Visualizations,但是这一类工作的可视化形式是由用户直接操作所得到的,所以用户直接操作无法得到编程的全部能力。当前工作的上一个工作是用户直接编辑代码直接得到可视化元素,用户直接操作可视化元素可以修改代码中的各种参数。本工作的目标是使用尽量少的键盘,更多的使用鼠标完成用户交互的过程。

下图所示为本文的工作中的系统流程图,首先用户绘制可视化形式,可视化形式可以产生代码,用户可以将多个可视化元素之间建立关联,用户可以对于多个绘制元素的方法进行抽象从而得到绘制的函数。相对于之前的系统,在本系统中增加的功能是用户可以直接绘制可视化元素得到绘制可视化元素的代码,

信息可视化中的吸引效应(The Attraction Effect in Information Visualization)

吸引效应是人在两个选择之间的决定会被第三个不相关的选择所影响,这在心理学中是一个被广泛研究的问题。可视化是支持用户的决策的重要方式,比如当我们选择一个要购买的房子或者选择一个要雇佣的雇员,可视化可以帮助用户选择最优的决策方案,然而系统所导致的偏差会产生非常重要的影响。吸引效应所造成的认知偏差,目前仅仅在三个选择中被验证,并且仅仅使用表格,文本,图片的形式,但是其所造成认知偏差同样出现在可视化中。本文为了研究吸引效应在可视化中的存在情况,设计并完成了两个用户调研,在第一个众包的实验中,本文实际上重复了吸引效应的经典实验并且将其拓展到可视化中,并且发现在可视化中具有同样的用户认知偏差;第二个实验主要针对的是吸引效应是否可以被扩展到更大的数据集上,这一类的数据集因为数量的原因难以使用数据表格进行展现。实验结果同样表明,吸引效应所导致的偏差大规模数据集的散点图中同样存在。[1]

继续阅读 »

北京大学2017年校园开放日实验室成果演示

2017年5月20日是北京大学校园开放日,实验室安排了在可视化与可视分析方面的最新成果向公众演示,包括湍流可视化,交通数据、微博数据可视分析,伪基站数据可视分析等科研项目。此次开放日实验室接待的参观者包括来自中小学生及其家长等百余人。实验室成员陈思明,洪帆,张江,赖楚凡,叶唐陟,陈帅,李国政,刘强强,冯璐,张宇,施悦凝等多位同学参与了本次开放日演示工作,向参观者介绍相关的工作,并面对面解答参观者的各种问题。今年校园开放日,实验室增加了HoloLens沉浸式可视化等项目,让参观者亲自体验可视化的乐趣。可视化能将复杂的数据转换为更容易理解的方式传递给受众,本次活动,很好地向公众普及了可视化的最新进展,受到参观者的好评。

继续阅读 »

FaVVEs: 不同抽象层次的多个图标结合的方式可视化数据的不同属性(Faceted Views of Varying Emphasis (FaVVEs): a framework for visualising multi-perspective small multiples)

在可视化中,大部分数据存在多个不同的属性,比如说空间,时间以及描述性的信息等角度,分析人员需要同时研究不同的属性。然而目前存在的并排图标(small multiple)将不同的属性分开比较的方法使得用户难以对于数据进行分析。为了辅助用户同时获得同时分析数据集的不同属性,本文提出了框架FaVVEs,将支持将不同的并排图标叠加在一起进行显示,同时通过动态调整图标的抽象程度,尽可能的避免并排图标的遮挡问题。本文针对图标并排显示以及叠加显示进行了用户测评。

继续阅读 »

让边绑定更加清晰:网络可视化中融合绘制方式的探索(Towards Unambiguous Edge Bundling: Investigating Confluent Drawings for Network Visualization)

本文采用了Confluent Drawing(CD)这种技术,相比较传统的spatial edge-bundling(EB)的方法的优点在于能够按照图的拓扑结构进行边绑定(只有起点与终点相同的边才会在绑定在一起),因此所得到的结果会更加注重图的连接关系。本文所采用的Confluent Drawing(CD)技术是在Power Graph(PG)的基础上完成的,在得到Confluent Drawing的绘制结果之后,文章从系统分析的角度使用图中经常出现的motif检验Confluent Drawing的绘制效果,并且通过User Study的方式比较四种常用的消除连接模糊(edge ambiguity)方法。
继续阅读 »

VisFlow – 针对表格的子集数据流模型web可视化框架(Web-based Visualization Framework for Tabular Data with a Subset Flow Model )

在可视化中,数据分析是一个典型的需要交互过程,在这个过程中即需要对于数据的可视化展示同时也需要对于数据交互的查询。数据分析通常都是从对于数据的全局概览开始,然后逐步的深入到数据子集中,直到这个数据子集能够解答用户想要探索的问题。数据探索过程是基于数据的属性进行的,因此辅助数据探索的工具需要足够灵活并且支持用户自定义的探索过程。因此,本文[1]提出了子集数据流模型的web可视化框架VisFlow,通过提供迅速的交互反馈,数据筛选以及视图链接,大大提高了在数据探索与交互查询过程中的交互能力。同时本文实现了以VisFlow框架为基础的原型系统,并且通过case study来验证VisFlow系统的有效性。

继续阅读 »

Maptrix: 嵌入地图的多对多流动数据可视化(Many-to-Many Geographically-Embedded Flow Visualisation: An Evaluation)

如何在地理位置中可视化流动信息是一个目前广泛研究的问题,尤其是多对多的流动信息,例如动物的移动,疾病、货物或者知识的传播。本文所做的工作提出了更有效的可视化形式Maptrix帮助用户分析这一类型的数据,设计合理详细的user study针对提出的maptrix可视化形式与Bundled Flow Map和OD Matrix进行有效性方面的比较。

继续阅读 »