IEEE Pacific Visualization 2016 Day 1

IEEE PacificVis 2016于4月19日到22日在台北的台湾科技大学举行。会议的第一天是PacificVAST议程。和后面几天的会议不一样,这一天会议的报告都是邀请制,成为一个供可视分析相关的研究者共享与他们的研究的一个很好的平台。本次PacificVAST由天津大学张加万教授与纽约大学Klaus Muller教授共同组织,邀请了12名可视分析领域的专家学者进行报告。报告分为4个部分,包括”交通轨迹与城市”、”看得更深”、”可视分析中的因果推断”、”日志与文本”。首先是这次PacificVis的logo,将中国的书法与英语结合,不仅不觉得生硬,反而有一种特色的美感。

6.pic_hdPacficVis 2016 展板以及其logo

7.pic_hd会议举办地–台湾科技大学

第一个部分的主题是交通和城市,主要讨论时空(spatial-temporal)数据,特别是轨迹数据的可视分析。轨迹数据的可视分析一直是可视化研究的一个重要领域。这类数据同时蕴含着空间和时间信息,可视化能帮助人们直观地理解这类数据,结合有效的分析,帮助领域专家发现问题、追寻原因,更好地规划城市。研讨会邀请了三位教授分别介绍了自己研究的相关工作。

来自本地的台湾交通大学的王昱舜教授首先介绍了他们基于车辆检测设备采集的交通数据开发的可视分析系统。如下图所示,系统左侧的Color-coded charts展示每个检测设备点采集的时序信息,结合右侧的地图上的监测点地理分布信息来可视化台北的交通状况。在Color-coded charts中每一行表示一个车辆检测点,横轴是时间,宽度代表车道占用率,颜色用来编码车辆速度或者车流量,该视图支持放大查看细节。

IMG_5366王昱舜教授演讲关于台湾交通数据的可视化系统

王昱舜教授介绍系统界面:左侧是Color-coded charts,右侧是地图

 

在此基础上,系统还支持查找相似的交通模式。如下图所示,6月20号的车流量比平常少,这是一个异常的交通模式,用户可以在系统上选定该时段,系统能够查找相似的模式(下图右侧)。往下分析可以发现这些日期由于台风的影响,车流量比往常少。

通过王昱舜介绍的系统查找相似的交通模式

来自浙江大学的巫英才介绍了把时序信息嵌入地图的方法。传统的地图上的道路面积不足以放下时序统计信息,系统将选的的道路变形扩宽,从而能够保证嵌入的可视化信息不会和原有地图产生交错(occlusion-free )。图3是他们的系统流程图。基于路网数据,用户选择关心的道路后系统拓宽选中的道路,将路网变形,最后在拓宽的道路上展示各种时变的可视化形式。

巫英才教授将时序信息嵌入地图工作的系统流程图

这个工作的关键步骤是拓宽选中的道路的同时尽可能保持原有的路网位置,利用了Seam Carving和 Network Optimization 两种算法。第一个算法Seam Carving是图像处理中的著名算法,它的作用是在拉伸图片的同时能尽可能保持图片中的物体不变形。这个算法的优点是容易实现并且能应用在栅格地图(raster map)上。另一个算法是网络优化算法,通过定义能量函数来求解优化问题。这个算法的优点是能处理带有复杂路网数据的矢量化地图(vector map)。

来自北京大学的袁晓如研究员展示了关于近几年新出现的稀疏轨迹数据的可视分析研究,具体包括南京市的RFID交通数据,带地理标签的微博数据。其中南京市的RFID交通数据记录了城市主要道路上几乎所有车辆的轨迹,非常适合做宏观交通分析。然而,车辆轨迹只在经过基站时才有记录,而车辆在相邻两个基站之间的精确轨迹无法得到。这种数据不确定性给分析带来了一定的难度。为此,系统首先设计了局部动画,只显示车辆在基站附近的移动。此外,系统不考虑单个车辆的微观运动,而集中研究大量车辆轨迹形成的宏观交通模式。系统应用轨迹数据聚集技术研究了基站以及基站间链路上的交通模式。接着,系统应用动态图可视化技术研究了这两种模式的相互关联,例如一个基站上的交通拥堵和周围链路上的交通流的关系,以及该拥堵和司机的路径选择的关系。此外,带有地理标签的微博数据也是一种稀疏轨迹数据。

case1-1不同时间段南京市的交通情况

IMG_5358袁晓如研究员与Klaus Mueller交谈

最后的讨论(Panel)中,大家讨论了开放时空分析系统的API的可能性。除了公用接口,袁晓如老师指出共享数据,举办类似VAST Challenge 的竞赛来让更多的人参与可以更好支持可视化的共享对接。今年七月在长沙举办的ChinaVis Data Challenge就是一个尝试。

在城市与交通Session的演讲者讨论可视化系统API开放的问题

在”看得更深”这个部分中,总共有3个报告。从这个形象生动的名字我们可以看出,这个部分主要是对数据的深入探索,三个报告的角度各不相同,第一位Barabora Kozlikova教授从生物学的方面进行介绍,探索如何使用可视分析来探索蛋白质分子中的轨道(Tunnel),利用不同的单个数据时变信息,融合成总体的时变轨道信息,让领域专家进行分析。第二位Michael Aupetit对降维进行了深入的分析,提出了一系列降维方法的优点与缺点,然后利用降维导致的变形(Distortion),将相关的原始数据信息通过一个颜色表映射成为投影的一个背景,来指导用户对降维分析以及增强降维投影可视化的理解性。最后一位Michael McGuffin教授介绍了增强现实技术的相关工作,讨论了它在可视分析领域究竟是否适用。

对生物学的探索

Barabora Kozlikova教授对Tunnel行为的可视分析探索

 Michael Aupetit老师介绍高维数据通过原始数据与高维数据的混合进行更好地增强语义

三个讨论都很有意思,其中关于降维的讨论十分有启发意义。讲者首先介绍了降维的优势 – 它可以保持数据在高维空间的相似性,再讨论了降维的问题 – 它会导致某些维度产生形变(Distort),对原有意义产生曲解。然后他们却利用了这样的缺点,对形变进行量化,并在最后降维结果中展现出来,这样对形变的量化能够让用户对高维投影的可视化增加理解,并且增加用户的交互去探索这些投影的形变程度。这个问题还可以衍生到其他高位投影的情况,他们的思想就是利用原有数据去增强(Enhance)投影,理解投影的形变。关于虚拟现实的交互讨论为大家带来了新的思维碰撞。Michael教授主要列举了几个问题,包括”增强现实是否适合现实3D数据”,”是否适合在3D环境下现实抽象数据”、”将硬件形式扩展,环绕用户”、”是否需要更自然的例如3D移动的输入”、”在虚拟和现实中的事物对象中显示连线”。在这几个问题中,他举出了许多有趣的例子,说明了对于3D数据的确是适合的,然而抽象数据在3D环境中并不能更好地让人理解,反而效果不如2D。他还用微软的一个硬件扩展交互的例子,来说明将硬件形式扩展了,用户可以更好地探索三维数据,就会像钢铁侠那样,拥有自然而和谐的人机交互体验。在另一个例子中,他用鼠标的移动选择操作和三维中的移动输入相比,得出了一个和他原先假设矛盾的地方,他发现竟然鼠标操作的效果对用户而言更好,虽然它需要移动、点击等操作。然而其他的例如3D中的移动,用户需要的时间更长。最后的问题,有一些”超现实”色彩,将数据与事物链接起来,这是一个庞大的工程,但充满了未来感。

针对可视分析中虚拟现实的优势,列出了五大待研究的问题。

Michael McGuffin教授将实体与虚拟物体相关联

下午的第三部分是关于可视分析中的因果推断,由Shiro Tanaka、Shuichi Onami、Koji Koyamada和Klaus Mueller等介绍,主要有关于生物信息学中的因果论断、时变体数据中的因果论断与因果论断的探索性可视分析等题目,也是精彩纷呈。其中对因果性推断概念,讲者们都讲到了一定注意不能将相关性等同于因果性,这也是现在许多人容易犯的错误。两个变量具有某种相关性,可能是正向因果,也可能是反向因果,更有可能的是它们两个变量和另一个变量产生的因果关系,同时导致它们相关变化。因此我们需要深入地了解这个问题。Shiro提出了在基因数据中,如何利用可视分析进行因果性探索。Koji则总结了可视分析的发展一大趋势,就是利用可视分析技术与已有的因果推断模型,进行交互式的因果推断探索。 Klaus Mueller在介绍它的用于归纳、探索因果关系的图可视化系统时,让我们体会到在高维空间内,如何在不同的属性中、探索出新的更深层次的因果关系。

 

10.pic_hd

对基因数据的因果关系探索

11.pic_hd

 对可视分析进行因果关系的基础设施的研究与探索

今天下午的第四个部分是关于Logs and Text,包括由Bettina Speckmann报告的CatVis: Interactive Visualization and Analysis of Very Large GLAM Data和由Fabian Beck报告的In-Situ Analytics: Using Word-Sized Visualizations for Integrated Data Analysis。

在第一个报告中,来自TU Eindhoven的 Speckmann  向大家展示了GlamMap。GLAM指的是Galleries, libraries, archives, musea。 GlamMap是一个基于地理空间的可视化工具,将GLAM数据映射到相应的地理位置上,通过设计的图形来总结每个地区的出版物的情况。下面这张地图中,每个图形展示了它所在区域的出版物,图形的大小表示了该区域出版物的数量,颜色可以映射出版年代等不同的信息(如图)。将每个地区的信息通过恰当的可视化视觉设计在地图上呈现出来,可以提高人们的检索效率。此外,GlamMap的工作也可以很容易地被移植到类似的数据上,例如GlottoVis可以用来展示各地濒危语言的情况。

GlamMap对全球出版物的可视化

14.pic_hd

GlamMap对全球方言现状的可视化

第二个报告是由University of Stuttgart的Fabian Beck报告,其演讲核心是通过仅占词语大小面积(Word-sized)的可视化来有效地表达数据,使得在尽可能小的空间内表达出有效信息。Fabian通过代码可视化、文献可视化、眼动数据可视化三个工作来举例。例如,下图展示了代码中函数调用过程中所用的时间、调用者、被调用者等多种信息。在文献可视化中,用户可以添加多种不同类型的筛选器来对论文进行筛选,利用单词大小的可视化图形中展示文献、关键词、聚类、主题等在筛选器上的分布。另外,在眼动数据可视化中,讨论了设计空间及如何将所需要展示的维度的信息通过词语大小空间展示出来。

代码可视化

字符大小的眼动数据EyeTracking的设计空间

该部分的演讲都在都十分注重于在较小的空间内进行视觉设计,用于传达文字所无法表现出来的信息。最典型的Word-sized的可视化是sparklines,将折线图与单词放置在一起来展示词语热度的时变趋势。Word-sized visualization通常更追求面积小、形式简洁但信息丰富。在Vis 2014的论文《Exploring the Placement and Design of Word-Scale Visualizations》还讨论了基于文本的Word-sized visualizations的设计空间和设计准则。

总结一天的议题,十分紧凑也收获满满,话题涵盖了可视分析的许多重要领域,包括时空轨迹可视分析,研究者们从不同的角度来探索轨迹信息的高维属性、时变特征、稀疏特性等,可视分析深入探索部分则对不同的应用例如生物技术、VR技术如何结合可视分析进行了深入的探讨;可视分析的因果分析给大家引入了新的视角,从关系的探索进一步到因果性的探索,里面需要大量的模型以及人的参与;最后在文本可视分析部分,关于出版物的全球分布、方言的现状、软件工程里的可视化都是有意思的话题。明天PacificVis将正式召开,与会者期待着更大的知识盛宴。

当然,除了正会之外,在台北第一天的所见所闻也是让人记忆颇深。

中午主办方提供了精致的菜肴,与会者共同在会议室内用餐,并同时热烈地进行着讨论。让人印象深刻的是吃饭后志愿者引导大家对垃圾进行分类的场景。他们在门口放好了三个桶,分别是可回收的垃圾、不可回收的垃圾与残食。

会议提供的可口精致的午饭

 

评论关闭。