IEEE Pacific Visualization 2015 Day 1

可视化三大风云际会之一IEEE PacificVis, 时隔六年再次来到中国(上一次是2009年在北京举办),于今年4月14-17日于杭州浙江大学紫金港校区举行,今天一早北大可视化小组一行20名参会代表来到了位于蒙民伟楼的报告厅。正式会议开始的前一天是IEEE PacificVis VAST研讨会,邀请来自世界各地的可视分析研究者作专题报告。

在 IEEE PacificVAST主席-北大袁晓如老师和天大张加万老师做了简单的介绍后,会议正式开始。首位讲者是来自德国斯图加特大学的 Tomas Ertl 教授。他提出了一个鲜明的观点:科学可视化虽然已经相对成熟,但并非停滞不前(SciVis is not dead!),它最近发展的重点是提供对复杂的大规模数据(例如模拟数据、遥感数据等)各种科学任务的分析。他报告了两个最新的研究项目:太阳动力学可视化(Solar Dynamics Visualization)、双相流体动力学可视化(Two-Phase Flow Dynamics Visualization)。第一个工作是针对太阳观测数据,把得到的图像内容提取转化成三维的模型,方便科学家来分析,他们的可视化成果可以帮助科学家发现拓扑结构的连续性,这个连续性从之前的图像中是无法发现的。第二个工作是对水滴滴下过程的可视化。他们检测水滴滴落过程中拓扑结构变化,然后用动态图可视化的方法来表示这个拓扑结构随时间变化的过程。事实上,用 Tracking Graph 来追踪展示特征的科学可视化方法是很直观有效的方法,并不罕见。我们在 IEEE VIS 14 的 Poster Ensemble Graph 也是用 tracking graph 对高差异区域的追踪和提示的一种应用。他们用尽可能直观的方式(tracking graph)展示了想表达的内容(topology evolution),辅以交互技术支持数据的探索和分析(interactive linked view & animation),是比较有效的、完整的、细致的工作。

Tomas Ertl 教授报告

Tomas Ertl 教授报告

Tomas Ertl 教授在参与讨论问题

Tomas Ertl 教授在参与讨论问题

第二位讲者是来自印度的 Vijay Natarajan教授,报告有关对称性检测方面的工作(Symmetry in Scalar Fields: An Approach to Query based Exploration)。对称性检测在很多实际应用中都非常重要,可以更好地帮助科学家理解数据的内存规律与特性。现有的对称性检测方法要么对噪音敏感,要么计算复杂度很大。他们提出的方法不仅对噪音不那么敏感,而且计算量更小。他们使用了增强极值图(augmented extremum graph)来检测对称性,增强极值图中每个节点都是测地距离中的极值点。增强极值图不仅考虑了标量场的 topology 信息,还考虑了几何信息,因此它更鲁棒。此外,他们还提出了使用抗平移、抗旋转以及抗缩放的空间描述符来提取标量场中的对称性信息,他们使用 contour tree 来表示所有 isosurface,从而把检测标量场的对称性转化成树中子树的对称性检测。这种方法的最大优点就是可以实现多尺度分析。

此后来自美国宾夕法尼亚州州立大学的张小龙教授针对可视分析研究中的一些验证/工程问题发表了启发式的报告。

宾夕法尼亚州州立大学的张小龙教授报告

宾夕法尼亚州州立大学的张小龙教授报告

观众提问

观众提问

在城市数据可视分析部分,张加万老师报告关于天津城市可视分析。 他们基于天津城建服务热线 12319 数据来展示城市事件发展的可视分析。比如通过展示所有对城市暖气供应的时空分布,以及举报内容语义本身,来分析暖气故障的发生和进展,帮助城市建设。让人联想到两百年前 John Snow 关于伦敦霍乱的可视化经典例子,这种直观的方式不仅可以帮助决策者知道紧急事件的进展,并且找到可能的事故原因来帮助排除故障。这样的工作如果能对公众开放,甚至合成到城建服务本身的举报过程中,更有使用的意义,比如同一个事件被举报多次这样的情形就完全可以避免,直接转变成 crowd sourcing 的形式。

天津大学张加万教授报告

天津大学张加万教授报告

我们实验室的梁婕博士报告了北大实验室最近一些相关工作,包括对于微博用户轨迹分析以及微博主题地图的绘制。浙江工业大学的姜晓睿博士报告了所在研究组开展的和城市数据有关的研究,包括对于在道路上嵌入交通流量图的尝试等。

浙江大学的陈为教授报告了融合多种数据进行交互可视化挖掘的工作。一个典型的例子是通过结合出租车轨迹,微博等数据,查询在微博上报告丢失在出租车的手机,最终跟踪到相关车辆。他们构建了一个较为庞大的系统,可以分析异构的不同源数据,并且设计一套灵活的交互分析流程,可以允许用户探索 what、when、who、where 以及 why 这五个分析中的重要因素。通过手机信号分析城市交通通勤情况也是有趣的案例。在讨论部分,与会者还对相关研究中的隐私问题,数据可获得性等问题展开了热烈的讨论。

浙江大学陈为教授报告

浙江大学陈为教授报告

在下午的报告中微软的 Bongshin Lee 讲了 stacked flow 在 multitouch device 上的扩展工作,以及基于白板和手势的 narrative visualization:SketchStory。即使是对交互方向并不是很熟悉的人也会觉得她们的手势交互 presentation 很有趣。这个工作事实上是糅合了很多方面,作者事实上可以把基于手势的可视化与基于白板的可视化拆开独立研究,而且白板在这里可以被任何显示设备取代,如何用限定的手势来定制一个 presentation 才是他们最大的贡献。

悉尼大学的 Seokhee Hong 教授介绍了在大型复杂图的可视分析方面的工作。她认为目前大型图的可视化,存在计算复杂,耗费时间长,展示的图边交叉严重等现象。同时她指出 Edge bundling 方法可以获取更好的可读性,但是数据的内在细节信息难以展示。她认为,目前大型图数据的可视化存在的问题,一是传统的算法考虑边交叉代价,但是引力、斥力的方式并不适合用来展示大图,大图的可布局算法需要新的度量方式;此外,在保证细节可读性良好的情况下,保证算法具有较好的可扩展性是一个大挑战。
来自中科院的时磊老师展示了影响图(Influence Graph)可视化。他们提出并定义了 influence graph summerization(IGS)问题,给出了一个解法。他们的方法不仅利用了影像图本身具有的流(flow),还利用了结点的多个属性(rich attributes)。他用一个 Citation graph 的案例来展示他们的结果。

中国工业界可视分析(Visual Analytics in China Industry Market)这一部分邀请了来自奇虎360、财新、阿里巴巴的业界代表进行演讲。从三位代表的演讲可以看出,在三个公司的可视化风格上其实有较大的差别。其中,财新的可视新闻给我们留下了深刻的印象。财新是国内数据新闻领域的领头羊,他们的作品《周永康的人与财》曾经被广泛传播,颇具影响力。此外他们还有《青岛中石化管道爆炸事故》、《星空彩绘诺贝尔》、《中东地区的敌友关系》、《三公消费龙虎榜》等可视化作品。

新闻媒体领域的可视化与学术所做的可视化研究工作是不同的。媒体领域可视化与可视分析作品的目标受众是最为广大的读者群体,他们来自各行各业,文化水平、知识背景差异很大,所以需要可视化尽可能简单,让读者能够很容易地明白可视化所表达的意思,却又能从中得到有趣有意思的结果。以前新闻媒体上常出现静态的信息图来帮助展示数据,吸引读者。而随着互联网的发展,动态可交互的可视化图表越来越受到关注,因为这样的形式能够展示更多的数据,同时可以激发起读者自行探索的乐趣。我们和 Industry Session 的其中一位讲者,財新网的陈嘉慧谈了一下关于他们可视化工作室的状况、他们的一个可视化项目的人员编配合作方式,还有完成一个可视化项目的开发过程。他们对可视化的看法和我们最大的不同是,我们更希望从解决问题出发来设计可视化的形式,而他们是从展示数据的初衷来设计的,所以他们对可视化中内容和传达的信息比我们要敏锐得多。比如周永康案例的可视化,最简单的图标和弧线图直接表示,其实已经可以满足,因为简单也是这个可视化的优势之一。

美国石溪大学的 Klaus Muller 教授基于平行坐标技术,并以气象数据为例,报告了他们在高维数据可视化方面的研究工作。报告内容主要关注了三个方面,分别是平行坐标的表达性、轴排序问题、以及基于相关性的因果推理。在表达性方面,由于容易产生视觉混杂(Visual Clutter),平行坐标难以表现出显著的数据趋势,使其不适用于展示性的场合如商业报告、新闻陈述等。基于该问题,Klaus 介绍了解释性平行坐标(Illustrative Parallel Coordinates)的工作。在经过数据聚类和视觉简化后,解释性平行坐标能够较好地表达数据趋势,而背后的细节都被有选择地隐藏了起来。但即使是作了聚类和简化,不恰当的坐标轴排序依然会隐藏大量数据特征。针对这一问题,Klaus 引入了相关图(Correlation Graph)的设计。在这个点边图(Node-Link Graph)里,每个点代表一个维度,点之间的距离表征了不同维度间的相关程度,而边的颜色表达了相关的正负性。如果以相关性来衡量数据特征是否明显,则平行坐标里相关的维度应该尽可能相邻,从而最佳的轴排序在相关图中就是遍历所有点的最短路径,即旅行商(TSP)问题。通过自动或交互地指定遍历路径,相关图能帮助用户进行灵活的坐标轴排序,以发掘隐藏的相关特征。尽管相关图表现了各维度的相关性,但用户无法了解相关关系中的因果性。为了辅助用户作进一步的因果分析,Klaus将相关图拓展成有向图,以表达各因素间的因果方向。通过分析相关性明显的因果关系,用户就能有目的地调整其中的“原因”维度,来影响作为“结果”的数据属性。

清华大学的刘世霞老师报告了文本可视分析的工作。同样刚从微软亚洲研究院来到浙江大学的巫英才老师报告了近期关于各种行为数据的可视分析工作。他强调了行为分析不仅仅对于行为本身的抽取与呈现,更需要关注不同用户的行为之间的关联关系。用户行为数据可以分为两类,一类是显示用户行为,即可以直观记录下的行为,另一种是隐式用户行为,主要是针对社交网络中,用户转移自身注意力、吸引他人注意力、讲观点传播给他人的行为。每种数据都有其独特的分析挑战。在显示行为的可视化中,以用户在不同搜索引擎的搜索行为数据进行分析。用户对于不同搜索引擎的忠诚度,可以通过搜索行为来直接表现出来,但其中主要的挑战在于数据量很大,需要对于大量的数据进行实时可视化,并且关联行为在不同时间的行为,进行追踪与分析。最后由于大量非结构化数据的存在,难以直观地将所有数据都可视化出来。

清华大学刘世霞教授报告

清华大学刘世霞教授报告

这个 Session 中还有是来自 Ochanomizu University 的 Takayuki Itoh 报告的音乐可视分析,包括两个工作:总谱可视化 ColorScore,用色块来展示交响乐中各个声部,MusicCube,把乐曲按照特征投影到三维空间方便用户浏览。报告后我们向伊藤教授请教了三个问题:首先是关于如何识别一首交响曲中重复多次但不尽相同的主题动机片段;第二是互联网上有很多关于音乐的评论,如何将这些文本语料加以利用在音乐可视化中;第三是现在的研究仅限于 midi 格式的符号数据,而未考虑语音格式数据,有没有什么解决的方法。对于第一个问题,伊藤教授的可视化目前只能靠人力来识别相似的结构,我认为事实上如果限定于 midi 格式的音乐,完全有能力用机器学习的方法来达到半自动识别相似结构的片段。第二个问题,伊藤教授说正是他们的 ongoing work,而第三个问题目前并没有好的解决方法,可能在几年后有不错的技术。之后刘世霞对音乐可视分析的 evaluation 和存在什么样的用户提出质疑。从一个音乐爱好者的角度看,也同样对 user evaluation 和 usability 方面存疑:毕竟没有受用用户和需求的可视化就没有其研究意义。但是 Itoh 的演讲给我们一些启发:一个可能的用处是,这对古典音乐的初学者或者不太接触音乐的大众来说,可视化可以起到解说的教学效果,因为大多交响曲占时近一个 小时,这对于一个试图欣赏古典乐,却看不懂总谱、对整个乐曲没有任何概念的人来说,想受熏陶却被冗长搞得无从下手和放弃。如果是可视化的方法就可以把 1 个小时的结构变成了一张直观的图片,可以首先给初次接触这首乐曲的人一个概括的印象,同时也是一个讲解音乐的入口。

来自 Ochanomizu University 的 Takayuki Itoh 教授报告

来自 Ochanomizu University 的 Takayuki Itoh 教授报告

PacificVAST各位讲者主要是介绍其近期的代表性工作,我们可以看到现在可视分析技术的不断发展,同时新的应用领域也层出不穷,我们期待更多有趣的工作。

PacificVAST 讲者合影

PacificVAST 讲者合影

评论关闭。