Chart Constellations: 对合作和多用户分析的有效图表总结(Effective Chart Summarization for Collaborative and Multi-User Analyses)

考虑一个大而复杂的数据集。如果你的任务是分析此数据集,你可以通过绘制几个图表进行探索性可视分析(EVA)。这种迭代的图表驱动方法很受欢迎,并得到Tableau等软件和Kaggle Kernels等数据科学笔记本的支持。不幸的是,由于数据集的深度或宽度,这样的任务对于一个人来说可能太多了。从这些领域中提取有趣知识的问题的直接解决方案并不清晰。一种方法是让多个分析师共同工作以发现结论,无论是作为一个团队(即协同工作)还是独立(每个分析师进行自己的调查)。但现在的问题是,我们如何理解并从这一分析中学习?

继续阅读 »

面向用户的主动学习算法(Towards User-Centered Active Learning Algorithms)

数据的标记在机器学习(ML)和可视分析中(VA)中都是一个非常基础的过程。但是,标记是一个很费时间的工作。所以需要一些更高效的标记策略。主动学习(AL)是一个旨在减少用户交互的一个机器学习的方法。它采用了候选选择策略(Candidate selection strategies),通过模型为用户选择出一些数据来进行标注。但是,用户并没有直接参与到实例的选择的过程中。数据标记同时也应用在可视分析中。可视分析中的实例选择和标记是用户驱动的。之前的工作曾经提出过可视化交互标记的想法来通过用户和模型来给出候选的数据。而这个工作[1]旨在进一步缩小AL和VA之间的距离。该工作做出了如下的贡献:(1)形式化用户的策略。(2)将用户的策略划分为11个低级别的模块。(3)在4个数据集上比较用户策略和AL策略。

继续阅读 »

大规模地理空间的源-目的地移动数据的视觉抽象(Visual Abstraction of Large Scale Geospatial Origin-Destination Movement Data)

大量的移动数据集以源 – 目的地(OD)形式表示,例如出租车旅行,移动电话位置等。作为可视化OD数据的常用方法,流图(flow map)经常因为大量的遮挡和交叉问题而难以发现移动的模式。过滤,聚类和边捆绑都可以减少流图的视觉混乱​​,但是OD流之间的相关性经常被忽略,这使得简化的OD流图呈现很少的语义信息。该工作[1]将OD流表征为单词和语句后通过Word2Vec模型来向量化处理。然后采用t-SNE对转换的高维向量进行降维,并设计了迭代的多目标采样方案以在矢量化表示空间中选择OD流。为了增强采样后OD流图的可读性,作者设计了抽象的流图以及flow wheel等呈现OD流的相互作用,并且整合了一组定量比较技术来评估样本流。基于真实数据集的案例研究和领域专家的访谈证明了该系统在减少视觉混乱和增强OD流量相关性方面的有效性。

继续阅读 »

Gaussian Cubes: 在大规模多维数据的可视化探索中实时建模 (Gaussian Cubes: Real-Time Modeling for Visual Exploration of Large Multidimensional Datasets)

大规模数据的可视化探索中存在着两个互相矛盾的需求:表达能力和计算效率。近来提出的一些方法,比如Nanocubes和imMens,使得大数据集上的实时交互探索成为可能。然而,它们支持的分析种类有限,只能快速得到直方图和heatmaps等。为了改善这一情况,文章提出了Gaussian Cubes,可以对数据进行交互式地建模,包括线性最小二乘法,主成分分析等。

与基于data cubes的方法不同,在它们的基础上,除了预先计算数据子集的数量 (count),Gaussian Cubes还提前计算了数据子集的多元高斯分布,这使得它能够在一秒内对具有百万点的数据拟合数百个模型。

继续阅读 »

SparseLeap:一种大规模体绘制中高效的空体素跳跃方法(SparseLeap: Efficient Empty Space Skipping for Large-Scale Volume Rendering)

体渲染是体数据可视化中的一项重要的任务,体渲染主要分为等值面体渲染(Iso-surface Volume Rendering)及直接体渲染(Direct Volume Rendering), 而在直接体渲染中,最为广泛使用的是光线投射算法(Ray-casting)。对于大规模的体数据,在使用光线投射算法进行体渲染时,若不跳过空白区域,即进行空体素跳跃,则会产生极大的运算量。然而大规模体数据,如神经元、皮肤数据,往往具有精细复杂的结构,这使得空体素跳跃变得极为困难。

继续阅读 »

用手绘无尺度限制草图查询时间序列(Expressive Time Series Querying with Hand-Drawn Scale-Free Sketches)

Qetch’s user interface

关于时间序列查询的工作已有不少,不论是利用形状定义语言SDL或是正则表达式匹配算法进行查询,还是功能强大的TimeSearcher、基于手绘草图的QuerySketch、QueryLines、RINSE、TimeSketch等。但是他们都有各自的缺点,SDL和正则表达式太不直观,不易于使用,查询系统有都有各自的限制。对于时间序列的查询,目前仍然没有很好的解决方案。

本文来自CHI 2018,设计并实现了时间序列查询系统Qetch,并在其中使用了全新的算法。评估表明,Qetch在许多任务中表现优异。

继续阅读 »

新型交互技术 – Michael Mcguffin (ETS)

2018年7月22日(第十届可视化发展前沿研究生暑期学校第七天)上午,来自加拿大蒙特利尔École de Technologie Supérieure (ETS)的Michael Mcguffin教授向大家介绍了可视化原型设计以及菜单设计相关知识。Michael McGuffin是加拿大魁北克蒙特利尔École de Technologie Supérieure的副教授,研究方向为信息可视化和人机交互,曾获IEEE InfoVis 2009最佳论文提名奖。

继续阅读 »

图绘制 – Peter Eades (悉尼大学)

2018年7月18日(第十届可视化发展前沿研究生暑期学校第三天)上午,来自悉尼大学的Peter Eades教授为暑期学校的学员们做了题为《Graph Drawing》的课程授课。Peter Eades教授于1978从澳大利亚国立大学获博士学位,并在世界各地的大学和研究机构工作。Peter主要研究图绘制,并在1984的论文中[1]首次提出了力导向算法的原型,是图布局最经典的绘制算法。

继续阅读 »

虚拟工作桌:舒适高效的沉浸式信息可视化方法(VirtualDesk: A Comfortable and Efficient Immersive Information Visualization Approach)

在许多情况下,3D呈现是很有用的,有其优点例如:快速构建空间数据的心理模型、大图中清晰的空间分割、散点图中三变量的模式发现。但是3D呈现长期以来也面对着感知和交互上的挑战,如:透视失真、笨重易错的数据探索、与传统二维的交互设备失配。而当前结合全景呈现和自然交互的沉浸式技术正在逐步被认为是解决这一问题的方法,但这一领域仍需要规范的指导方针和更多深入研究,尤其是在抽象数据的信息可视化领域。

目前许多已经提出的沉浸式可视化及交互方法在实际中并不太实用,可能导致用户3D晕眩,或是需要过多的探索时间与空间。飞行导航的方法比较费时,同时又容易使用户产生不舒适感;真实走动导航方法效率太低。在这篇论文的工作中,研究者们实现并评估了一种新式的数据探索方式:VirtualDesk。

继续阅读 »

使用上下文显著性驱动的射线剖面分析算法对于感兴趣特征进行直接体绘制(Feature of Interest-Based Direct Volume Rendering Using Contextual Saliency-Driven Ray Profile Analysis)

现今的科学研究中,体数据的存储形式被广泛应用于各个领域,对于体数据的研究占据了非常重要的地位。其中直接体绘制技术可以通过设计传递函数(TF),来引导用户关注体数据特定子集,从而十分有效地地帮助用户深入理解体数据。在传递函数的设计问题中,有两个主要讨论的问题。其一是对于感兴趣的特征区域(FOI)的定义问题,这在研究复杂的体数据的场景下较为困难,同时特征区域选取的准确性也难以较好地保证。其二是在特征区域上施加视觉强化的效果,这可以通过对于特征区域设定恰当的光学参数来实现。但这样的过程常常会涉及到一个重复的错误尝试的过程,同时会引入很多十分低效的手动的参数调整。因此需要考虑一定的策略来有效的进行传递函数的设计。本文提出一种使用上下文显著性驱动的射线剖面分析算法对于感兴趣特征进行直接体绘制,有效地解决了这一问题。

继续阅读 »