PacificVis 2019 – Day 1

PacificVis 2019会议于4月23日在泰国曼谷召开,会议协办方是泰国朱拉隆功大学(Chulalongkorn University)的朱拉隆功商学院(Chulalongkorn Business School)。本届会议的论文主席是来自美国Arizona State University的Ross Maciejewski,来自韩国Seoul National University的Jinwook Seo,来自德国Technical University of Munich的Rüdiger Westermann。

会议第一天是PacificVAST 2019的相关内容,主要包括3个keynote talks 两个invited talks,以及论文报告。

PacificVAST的第一个keynote是来自亚利桑那州立大学的教授Ross Maciejewski,keynote的题目是PredictIve Visual Analytics: Pitfall and Potential。可视化使用先进的可视分析经验从而允许用户分析探索数据,这允许用户的专业知识与机器的计算能力相结合

Ross Maciejewski教授作题为PredictIve Visual Analytics: Pitfall and Potential的报告

 

用户在进行数据分析的时候对于行为进行预测是非常重要的一个方面,针对预测的问题,Maciejewski教授提出了Predictive Visual analytics的分析方法,PCA的分析流程从数据预处理开始,进一步提取数据,进行建模,通过选择模型进行建模的分析流程,最后一步对于分析的流程进行检验。在这个过程中,前面的步骤都可以通过可视分析的方法进行辅助。Maciejewski教授的KeyNote重点介绍了他们在上述的四个方面与可视分析相结合的一系列工作。

来自韩国首尔大学的 Jinwook Seo 教授为大家带来第二个keynote talk,关于高维数据可视化推荐。

Jinwook Seo教授为大家带来关于高维数据可视化推荐的keynote talk

在现有的高维数据可视化方法中,如平行坐标、散点图矩阵等等,存在如下的问题:

  1. 随着维度的增加,可视化的组合方式将呈现指数型增长;
  2. 对于超过3个维度的可视化方式具有很大的认知难度;
  3. 维度之间的关联信息很难探索;
  4. 可扩展性不高。

当然,现在也有很多数据降维的方式应用到可视化中,如 PCA, MDS等等。数据降维的方式的弊端就是失去了数据原始的信息。因此,基于这些问题,研究员或用户很难对于一个高维数据选择一个恰当的可视化方式,Jinwook Seo 教授从三个方面给大家带来了高维数据可视化推荐:

  1. 基于排序的可视化推荐

基于排序的可视化推荐是指对于高维数据的每个维度进行权重的排序。Jinwook Seo 教授指出可以对单个维度进行排序、进而到两个维度组合的排序,最终得出每个维度的权重。用户进行选择排序的过程可以不断地迭代循环,直到符合用户的要求。基于他们提出的排序方法,可以将一个维度的排序结果和两个维度的排序结果整合在一起,并且可以支持多种排序方法。

  1. 基于探究的可视化推荐

由于目前的可视化推荐的方法没有将用户探究的过程记录下来,导致用户每次进行探索时都需要重新进行。基于探究的可视化推荐是指系统会根据用户的探究路路径推荐相应的探究方向,用户可以整理并不断地扩展、组织或者排除一些特征进行探究,他们提出的方法中使用 Dendrogram 可视化的方法来展示用户的探究路径并推荐相关的维度。

  1. 推荐的可视化表示形式

最后,Jinwook Seo 教授指出目前的可视化推荐系统都是简单使用 Preview 的方法进行推荐。他们希望研究不同的可视化推荐方式的有效性。因此,他们通过实验比较了Preview, Title,  Animated Transition 和 Textual Description 推荐的效果。通过实验结果指出多种可视化推荐形式相结合,并能够基于用户探索的过程进行推荐的方法能够得到更好的结果。

来自Universität Duisburg-Essen的Fabian Beck主持了 Visual Analytics Systems 相关论文的session。

在当前的大数据时代,软件系统的数量,代码量以及代码之间的依赖关系变得越来越复杂。如何理解这些软件系统之间的关系是一件非常有挑战性的任务。在软件系统中的代码片段拷贝有很大的危害,Clone-World[1]通过构建可视分析系统帮助用户发现并且进一步解决软件系统中的代码拷贝的问题。

在天文学领域,数据管理与探索对于理解该领域的数据非常重要,但是考虑到宇航员无法编程,aflak[2]提出了一个可视编程框架,支持用户上传数据,对于数据进行变换,然后实时地对于数据进行可视化,从而支持用户交互式地分析在天文学领域的高维数据。

来自Sejong University的Yun Jang主持了 AI and VIS 相关论文的session。

Mohammad等[3]提出了一种可视化分析方法,将各种机器学习功能与可视化视图相结合,所有这些都集成在mVis(多变量可视化系统)中。 技术调色板允许分析人员对多变量数据集执行探索性数据分析,并将其划分为有意义的标记分区,从中可以构建分类器。 用户可以在半监督过程中标记有趣的模式。·1用户就可以通过有监督的机器学习继续工作流程,以评估后续分类器有效学习标记的训练数据集中表达的概念的程度。

并行集(Parallel Set)是一种流行的分类数据可视化技术,它直观地在细节中揭示基于频率的关系,但是高维分类数据集带来了混乱的视觉显示,模糊了关系探索。关联规则挖掘是发现分类变量之间关系的流行方法。它可以让并行集以有意义的方式对色带进行分组。Chong Zhang等[4]将这两种方法整合到一个可视化分析系统中,用于探索具有二分结果的高维分类数据。该系统不仅可以帮助用户直观地解释关联规则,还可以为更少集群和更有组织的可视化提供有效的维度和类别缩减方法。

4月23日下午,来自日本庆应义塾大学的 Issei Fujishiro 教授给出了关于可视分析中的“起源”(Provenance)管理的keynote talk。所谓起源,是可以重新产生一部分数据或者判断的信息。

Fujishiro教授的报告主要分为两部分:第一部分是关于 VIDELICET(可视化设计及生命周期管理Visualization Design and life cycle management,  PVAST13)。VIDELICET是一个环,从1)初始可视化设计到 2)检查依赖,到3)半自动化,最后再到4)版本管理的周期。可扩展的起源管理可以为用户提供可是分析生命周期中的带约束的自由。

VIDELICET支持初始化的管理,用户可以选择目标数据、目标效果指定产生初始的可视化。VIDELICET收集了成功的可视化设计,提供了样例可以直接使用。例如:基于拓扑增强的体数据可视化可以在体数据内部提供支架来对效果进行增强。

版本管理亦是重要的一部分,在可视化设计过程中对中间的结果进行记录。但是这样势必会导致巨大的存储空间。在VIDELICET中,系统可以对中间过程进行约减总结以降低冗余的空间。

第二部分是关于稀疏建模的高维数据挖掘来尽量保证高效性和准确性。fujishiro 教授介绍了对称双聚类算法,通过对原始的平行坐标系进行聚类约减,并可以动态对相应的平行坐标中的维度进行调整、实时观察聚类变化。使用本系统可以高效产生专家原先使用传统方法研究数十年得到的结果。

此外,fujishiro教授还介绍了aflak和Spectrail两个相关工作。

来自天津大学的张加万教授主持了 Visual Encoding for Analytics的论文session。

通过分析用户的行为可以优化可视化中视觉编码的设计,但是目前的大多数研究针对的是简单的可视化与任务,如何通过分析复杂的任务与可视化完成对于可视化中视觉编码的优化是一个非常重要的研究问题。Yuki等人的论文“Exploration Behavior of group-in-a-box layouts”选取了在graph可视化形式中的group-in-a-box(GIB)的可视化形式,研究者可以改变可视化设计中的不同的参数,从而其探索对于用户的执行任务的影响。

针对地理信息数据,用户能够很容易的探索单变量的地理信息数据,但是用户却很难仅仅通过可视化的方法探索挖掘具有两个变量的地理信息数据中所包含的信息,比如变量之间的相关关系,最大值,最小值等信息,但是文本对于用户确实容易接受的信息形式。Shahid等人[6]的工作通过结合可视化与文本分析的方法,帮助用户探索Bivariate的地理信息数据中所包含启示。本文结合了自然语言处理的方法生成用户熟悉的文本,同时采用sparkline的方法帮助用户建立所得到的结论与原始可视化之间的关联。

今天的会议有两个invited talks。

来自百度的李德清给大家带来了题为ECharts: A declarative framework for rapid construction of web-based visualization 的演讲。她详细介绍了他们的产品 ECharts (如图1所示)。ECharts 是一个开源的,基于Web的跨平台框架,支持交互式可视化的快速构建。她从易于使用,丰富的交互和高性能三个方面证实了ECharts的有效性。

 

李德清在讲解ECharts

 

最终研究员通过通过比较 ECharts 与 C3.js, HighCharts, Chart.js 的实用性和性能,实验结果表明了该框架的有效性和可扩展性。

来自于华为云的丁治宇博士发表了第二个invited talk。丁治宇博士2015年毕业于浙江大学,目前就职于华为云,担任华为云的资深技术专家。丁治宇博士报告的内容是结合他在华为的工作经验讨论他对于可视化与人工智能在商业产品中的应用的一下经验。

丁治宇博士首先讨论了当前工业的现状,即工业界对于可视化的具体需求。其次,他介绍了在工业问题中的具体解决方案,包括从可视分析的方案以及人工智能的解决方案。在工业问题中,可视分析的方法更加适用于在不确定的规则下,对于未知或者不可解释的现象的研究,而人工智能更适用于重复的,对于确切规则以及已知现象的应用场景。最后丁治宇博士介绍了华为云在当前可视化方面的产品布局。丁治宇博士认为人工智能无法替代可视化,可视化能够提供给用户全局的概览以及具体的信息,而人工智能能够作为分解问题的基础辅助用户的计算。

此外,当天下午还有两个poster的展示。

[1] Mondal, D., Mondal, M., Roy, C. K., Schneider, K. A., Li, Y., & Wang, S. Clone-World: A visual analytic system for large scale software clones. Visual Informatics, 2019.

[2] Boussejra, M. O., Uchiki, R., Takeshima, Y., Matsubayashi, K., Takekawa, S., Uemura, M., & Fujishiro, I. aflak: Visual programming environment enabling end-to-end provenance management for the analysis of astronomical datasets. Visual Informatics, 2019.

[3] Chegini, M., Bernard, J., Berger, P., Sourin, A., Andrews, K., & Schreck, T. Interactive labelling of a multivariate dataset for supervised machine learning using linked visualisations, clustering, and active learning. Visual Informatics, 2019.

[4] Zhang, C., Chen, Y., Yang, J., & Yin, Z. An association rule based approach to reducing visual clutter in parallel sets. Visual Informatics, 2019.

[5] Latif, S., & Beck, F. Interactive map reports summarizing bivariate geographic data. Visual Informatics, 2019.

评论关闭。