IEEE Pacific Visualization 2016 Day 2

IEEE PacificVis 2016的第二天正式进入论文报告环节。大会主席、台湾国立科技大学教授楊傳凱首先致开幕词,随后论文主席之一、犹他大学教授Charles D. Hansen介绍了今年PacificVis会议的论文提交情况。本届会议共收到97篇论文提交,最终接收29篇,录取率29.9%,和往年基本持平。其中6篇文章被推荐到TVCG。短篇论文(Notes)提交39篇,16篇被接收。

Keynote:可视分析与设计之庖丁解牛

今年PacificVis的主题演讲邀请了来自英属哥伦比亚大学(University of British Columbia)的Tamara Munzner教授。Tamara教授(https://www.cs.ubc.ca/~tmm/)是可视化领域的著名学者,她长期研究可视化与分析。2015年可视化年会(VIS)上获得可视化领域的技术成就奖(VGTC Technical Award)。她的著作《Visualization Analysis and Design》被誉为可视化设计的红宝书。

Tamara教授开场介绍演讲内容

在开场时,Tamara教授亲切地用中文和大家打招呼,她风趣地说自己学中文6年,但是忘了很多,所以还是用英文做报告。此次,Tamara教授带来的主题演讲题为”Visualization Analysis & Design”。演讲中,她基于最新著作《Visualization Analysis and Design》,阐述对可视化设计框架、可视分析的准则、以及设计原理的总结与思考。

Tamara教授将可视化分析与设计的过程进行结构化,解构出其中的各个环节,思考可视化设计准则。在报告开始,Tamara教授强调,将可视化设计作为一门学科,研究如何设计可视化以及用以分析具有重要的意义:一方面,为系统性的可视化设计提供准则、依据;另一方面,从一个跨领域(指科学可视化、信息可视化、可视分析)的焦点来思考可视化,以统一的视角来思考可视化的设计与分析。在巨大的可视化设计空间中,通过结构化的解构让可视化设计系统化,不仅能够对具体的一个可视化设计进行解构,还可以使用共同的可视化词汇将不同的可视化形式进行抽象,进而对比评估。

Tamara教授将可视化设计过程结构为4个层次+3个问题。在4个层次上,她从领域场景(为什么要使用可视分析解决领域问题)、抽象(将领域转换为可视化词汇,其中包括了数据的抽象,为什么需要等等)、方法(idom,如何可视化)以及实现算法(如何有效地实现)对可视分析的设计过程进行系统性的思考。首先,理解领域专家的问题,及应用场景,理解要解决的是什么问题;接着,将问题进行抽象,将具象的领域问题抽象为用可视分析的语言描述的问题;再思考可视分析所使用的方法;最后考虑具体实现的技术细节以及算法性能等。在这设计可视与分析的每个环节中,都可能产生影响可视化有效性的问题,如不理解领域专家问题、抽象表达欠缺、算法效率低等等。通过回答这些问题能够帮助我们评估可视设计的有效性。

在各设计环节中可能影响可视化有效性的问题

在可视化及分析可视设计的过程中,有3个问题:什么(what),为什么(why)、以及怎么做(how)需要正确回答。是什么,判断所面对的数据对象是什么样,具有哪些属性集合等;为什么,按照动作-目标对的解构方式,来发现、分析对象及动作,是否能够达到任务目的。有时候需要衍生出新的属性作为对象来完成任务。教授举了一个简单的例子,基于进出口量这个基本的数据项导出贸易平衡这个维度;怎么做,考虑如何使用图形标志和视觉映射进行表达。

除了基本的可视化,有三种策略来应对复杂的可视化,分别是视口操纵、联合多个窗口以及减小信息。由此衍生出庞大的设计空间:例如,在视口操纵中,例如视口变换,需要有连续的动画过滤来支持;联合多个窗口中包含了并列、交叠以及分割等方法,不同的布局方法会有不同的设计,例如视口关联,Small Multiple等等;减小数据的实现方式包括了过滤不相关数据、聚集数据等等。

构建复杂可视化的三种策略

在短短一个小时的主题演讲中,Tamara Munzner教授可视化设计框架进行了精简的介绍,对设计可视化具有重要的理论指导意义,更多的细节可以参考她的著作《Visualization Analysis and Design》。

Session 1: Perception and Interaction

这个Session包含4篇文章,主要介绍了几种可视化与交互形式的优化。

维也纳大学带来的第一份工作是针对高维数据可视化中数据投影效果的评价问题,他们提出了一种基于数据分离程度的衡量方案。在高维数据分析中,对数据进行降维投影、选择最佳子空间是一项重要工作,但是如何评价数据投影的效果并没有统一的方案。他们选择特征分离程度作为比较参数,将用户视觉上感知到的数据分离作为描述可视化结果优劣的指标。基于这个衡量指数,他们对2002种生成的特征分离方法进行比较,筛选出最适合的可视化方法,并对数据方案的选择提出建议。

特征分离算法生成

下一篇文章是山东大学对可视化投影比例选择算法的比较。他们指出,视图比例和线段的角度会显著影响用户对数据变化趋势的判断,45°是最佳的表现形式。在早期的文献中,基于曲线路径长度的视图比例选择算法(AL)被认为是相对优秀的方法,但是这种算法的具体优势和适用范围并不清楚。他们于是通过数学推演的方式,对AL的特征进行分析,并和其他几种常见的视图比例选择算法进行比较,包括平均斜率(AS)、加权平均绝对斜率(AWO)、中位绝对斜率(MS)、最大加权局部曲率(MLC)、最终偏移向量(RV)等。他们结果显示,AL、AWO和RV的效果相似,但是RV更稳定,对于某些特殊数据情况MLC结果更好。在具体实践中,RV是一种更加合适的选择。

投影比例算法

 接下来,北卡罗来纳大学的杨静教授针对散点图动画中的物体追踪表现形式进行了设计和改进。在传统的系统交互设计里,缩放与拖动都是分开的,导致用户关注的对象会超出视野。为了解决这个问题,本工作以气泡图为例,设计了一套自动的动画交互形式,能够追踪热点对象,自动移动和缩放画面。他们通过插值让画面移动更加顺畅,并添加聚光等效果让运动对象更加突出。

聚焦跟踪算法

最后一篇文章则把3D交互技术和数学教学结合起来,使用多点触摸让用户能够直接操作抽象的数学拓扑结构。

用户操作抽象的数学拓扑结构

Session 2: Graph Visualization

这个section包含4篇文章,主要涉及密集图,二部图以及流图的可视分析。

在密集的层次图中,尤其是趋近于完全图的图网络中,密集的边会严重影响布局的可读性和美观性。为此,京都大学的Yosuke Onoue等人提出新的边聚集方式来减少边的数量。已有的边聚集方法,并不能保证边的数量一定会减少,甚至有可能引入新的边;他们提出的方法,可以保证边的数量一定会减少(如图1)。基本思想是:检测图中大的二部完全图,然后按图所示,将m*n(n,m分别表示二部图两边的顶点数)条边转为m + n条边。这个方法的局限性在于二部完全图检测算法,目前,并不存在最优的算法来检测图中所有的二部完全图。其次,为了保证通过边聚集,边的数量一定会减少,他们提出的方法并不能保证图布局的美观性。

现有的边聚集方法不能保证边数量的减少

文章提出的边聚集方法

流图,可以方便的同时展示多个属性随时间的变化情况,每个属性随时间的变化,用类似条带的形式表示。但是堆叠的展示方式,使得用户难以比较条带与条带之间,或是属性与属性之间的差异。为此,香港科技大学的Tongshuang Wu等人提出PieceStack,在传统的流图基础上,根据条带在每个时段的特性,将条带分段,并对得到的分段数据进行聚类,使得具有类似特性的条带尽可能靠近;同时,为了方便用户比较不同条带之间的异同,他们提供了丰富的交互,比如过滤,调换条带之间的顺序等,如图所示。

PieceStack:用颜色表示条带的片段与整个流图在趋势上的相似;用圆形和菱形来表示该片段对整体和局部相似度的贡献。

当我们需要分析两个不同类型的实体之间的关系,二部图是不错的可视展示方式,但往往密集的边和顶点会影响视图的可读性和美观性。Panpan Xu等人在分析美国参议员的所属党派与其支持法案与修正案之间的关联关系时,从二部图中,提取任意两个顶点,共同连接的顶点个数(如图所示)。两个顶点之间共同连接的顶点数,表示了这两个顶点之间的相似程度。之后,用矩阵的形式展示顶点的相似程度。

提取任意两个顶点共同连接的顶点数

下图展示的可视分析系统,矩阵中每个cell表示两个顶点之间共同的顶点数,每行或是每列表示一个法案或修正案或是议员,颜色表示其所属类别,比如议员的党派。

矩阵的形式展示顶点的相似程度

社会网络图往往具有小世界网络的属性,即大部分节点彼此不相连,但绝大部分节点经过少数几步就可到达。若直接使用传统的图布局算法,比如力导向算法,得到的布局非常的密集,就像一个毛团,难以支持用户的分析与探索。有效的简化方法是,基于骨架(backbone)的方法。通过提出密集大图的骨架,过滤去除无关的边,来简化图。但这个方法,有诸多的参数需要调试。为此,德国康斯坦茨大学研究者研究这些参数对提取到的图骨架的影响,并根据其研究,推荐合适的参数给用户,以便得到更好的,更易于分析的图布局。

运用文章提出的方法调整的参数,得到的图布局

Notes 1: Graph/Network Section

来自法国的Romain Bourqui等人提出新的针对多层次图的边聚集(edge-bundling)方法。此处的多层次图指一个图中,具有多种类型的边。方法的大致流程是:首先提取每个层次的图(图中所有的边属于同一类型),然后在每个层次图上使用边聚集方法,随后,将所有层次图的边聚集结果融合起来,进行边平滑。最终结果如下图所示。

针对多层次图的边聚集(edge-bundling)方法:(a)原始图布局;(b)边聚集结果

 第二个note是关于交通起点和终点(origin-destination)流量的可视化(如下图)。在这个可视化中,他们将起点和终点分别用柱状图表示,柱状图的高度表示流量的大小,两个柱状图之间的连边,起点与终点之间的关系用连边表示。

交通起点和终点流量可视分析图

来自香港科技大学的Tongshuang Wu等人采用下图方式分析慕课网学生使用论坛进行讨论的情况。圆环表示论坛的话题,圆内的有向图中,顶点表示学生,大小表示其活跃程度;顶点a指向顶点b的边表示学生回复过学生b的问题或是评论。

网络图展示慕课网论坛讨论情况

来自澳大利亚的Weidong Huang等人曲线对人在点边图感知(graph perception)上的影响。通过一系列的实验,他们分析得到的结论是:一方面在点边图中,曲线可以增加图的美观性;但为了方便用户更好的理解分析图,使用曲线的时候,如果曲线之间有交叉,应尽量增大交叉的角度;同时,长曲线并不建议使用。

Notes: Surface, Flow and Motion

第一篇note是Screen-space Silhouettes for Visualizing Ensembles of 3D Isosurfaces。本文提出了一种新的集合模拟标量场数据的轮廓面(3D Silhouette)总结方法。解决传统的isosurface遮挡的问题。主要步骤为:1.使用ensemble标量场以及它的isovalues作为算法输入;2.预处理: 使用Marching Cubes生成mesh;3.聚类用于总结所有集合成员的主要趋势。先计算集合成员之间的相似度矩阵, 再使用层次聚类(hierarchical clustering)进行主要趋势(平均形态)的聚类。4.Rendering: 使用透明轮廓面将集合成员的主要趋势可视化出来

此外,他们还提供多种交互,例如,轮廓面的选取,使用 cutting plane查看轮廓面内部细节,从而查看局部区域集合成员的分布信息。用户还可以自己移动cutting plane以动画形式展现局部区域的细节。最后,本文还有一些局限性,目前还不支持时变集合标量场数据。

第二篇note是Visualizing the Variations of Ensemble of Isosurfaces。 本文与上一篇的motivation很相似,都是因为当前isosurface表示集合标量场有很多遮挡。上一篇通过三维轮廓面来减少isosurface视觉遮挡,轮廓面表示的是所有集合成员的平均形态。而本文针对isosurface可视化集合标量场时的自遮挡以及不同isovalue对应isosurfaces的遮挡问题,提出一些新的解决方法。本文isosurface是从差异场计算得到的(isovalue为variation)。首先,他们计算集合模拟差异场(每个格点一个差异值)。其次,使用给定的isovalue得到isosurface。因为isosurface有自遮挡问题,他们通过ray方向排序找到center-most和out-most的isosurface,解决多个isosurfaces之间的遮挡问题。

他们还使用PCP平行坐标表示 isovalues(差异值)的范围,值越小越可能是outlier,颜色表示相似度(蓝色表示相似度值越小,红色表示相似度大)。之后,他们用isosufrace-entropy找到variation比较大与比较小的区域。另外,本文的局限性是目前还不支持时变标量场。

第三篇note是A Bayesian Approach for Probabilistic Streamline Computation in Uncertain Flows。因为流线突然大角度转向的概率很小(prior probability),已知流线当前点的方向,所以可以用贝叶斯方法估计下一个时间步的方向。Streamline追踪时会有很大的uncertainty,尤其是观测值,不确定性更大。在本文中,他们对时不变流场中人为加入一些Gaussian 噪音来生成每个点的方向分布,进行模拟时不变流场的不确定性。

另一方面,因为uncertainty会在streamline追踪时全局性传播。因此,很有必要计算出这些很不确定的流线的平均形态(mean streamline)以及最有可能的流线形态(most likely streamline)。使用隐藏Markov模型与Bayesian概率模型计算下一个时间步(t)的出方向概率分布值。首先,对于每个格点,将上一个时间步(t-1)的方向概率分布作为Bayesian概率模型的先验概率值。再使用隐藏Markov模型计算下一个时间步与历史时间步的条件概率(Markov链上所有历史时间步的概率,本文中他们只使用了上一个时间步t-1作为所有的历史信息)。最后通过Bayesian模型计算后验概率分布。以该后验概率分布值作为每个出方向的权重。通过权重值计算最终流线平均走向的形态。此外,本文他们只针对流线进行实验。他们的下一步工作计划是扩展到迹线。

Reception

今年的PacificVis的迎接晚宴安排在台北的ChinaPa。在晚宴上,主办方提供了丰富可口的菜肴、优雅动听的音乐以及香醇浓郁的美酒,为参会人员进行交流的营造了轻松的氛围。在轻松愉快的环节下,大家可以结识同行、分享研究经验和成果;也可以获得难得的与前辈、学术大牛讨教交流的机会。这样自由放松的学术交流,与白天紧锣密鼓的正式的会议报告相辅相成,交相辉映,为2016 PacificVis锦上添花。

 

评论关闭。