作者存档: Wu, Cong

大规模粒子数据的计算属性上的交互选择 (Interactive Selection on Calculated Attributes of Large-Scale Particle Data)

在大规模的粒子数据中,有些属性需要在模拟过程中才能获得,比如温度、表面张力等。我们需要这些属性用来选择感兴趣区域的粒子,比如热点区域或者局部极值区域等,并在之后的模拟中观察粒子的变化情况。为了使用这些属性,我们可以首先运行一遍模拟过程,并把计算得到的属性保存下来,接着在系统中加载这些提前计算好的属性。然而,保存这些属性需要大量的磁盘空间,而且如果需要其他的属性,还需要再进行模拟以保存属性。另一种使用计算属性进行选择的方法是在模拟过程中实时计算并根据属性选择粒子,然而如果计算所有粒子的属性,模拟时需要分配更多的内存空间并使用更长的时间。本文结合3D视图刷选,提出了一种数据驱动的基于延迟计算的选择扩展方法[1]。

继续阅读 »

2021年北京大学可视化发展前沿研究生暑期学校 – Day 6

今天(2021年7月20日)的课程由来自马里兰大学的刘志成教授带来的主题为事件序列数据可视分析的报告以及来自蒙纳士大学的Tim Dwyer教授带来的主题为沉浸式分析的报告组成。

继续阅读 »

多视图多类别散点图的利用集合覆盖优化的数据采样 (Data Sampling in Multi-view and Multi-class Scatterplots via Set Cover Optimization)

对高维数据进行可视化,一个常用的方法是散点图。对于具有2个以上维度的数据,可以使用散点图矩阵(scatterplot matrix, SPLOM),其中每一个视图是某2个维度的散点图。随着数据量的增加,在散点图中可能出现点的重叠问题(overdrawing),影响后续的分析。有许多方法用来缓解这种问题,比如调整散点图中的符号(marker),改变它的大小、透明度、位置等;使用密度图;进行数据采样等。本文提出了一种在散点图矩阵中对多类别数据进行多视图联合优化的数据采样方法。

继续阅读 »

用于交通数据预测的深度时空3维卷积神经网络 (Deep Spatial–Temporal 3D Convolutional Neural Networks for Traffic Data Forecasting)

在智能交通系统中,可靠的交通预测具有重要的意义,可以帮助决策者制定更好的管理策略,也可以帮助人们调整出行计划。但是,交通预测中存在一些挑战:

  • 空间相关性:相邻区域的交通数据具有一定的相关性
  • 时间相关性:相邻时间的交通数据具有一定的相关性
  • 异质性:不同地区和时间相关性的贡献并不相同

本文提出了一种基于深度学习的时空交通预测网络,ST-3DNet,用来解决时空网格数据预测问题。ST-3DNet结合了3维卷积和残差单元,提出了一种再校准模块来描述空间维度上相关性的不同贡献,并结合局部和长期的时间模式来达到较好的效果。

继续阅读 »

一种用于多类密度图的声明式渲染模型 (A Declarative Rendering Model for Multiclass Density Maps)

当数据点具有两个quantitative属性和一个categorical属性时,就可以用multiclass maps展示,包括散点图,多维投影,主题地图等。如果点的数量很多,直接绘制会引起overplotting,降低可读性,此时需要进行一些处理,比如alpha blending、数据聚集等,来保持可读性。本文展示了multiclass density maps,对每一种category都计算出2维的histogram,通过分块提高可视化的表达力和可扩展性。在总结相关工作的基础上,作者设计了一种模型,通过声明式的语法来进行multiclass density maps的可视化,并且可以动态调整来得到不同的可视化结果。

继续阅读 »

Gaussian Cubes: 在大规模多维数据的可视化探索中实时建模 (Gaussian Cubes: Real-Time Modeling for Visual Exploration of Large Multidimensional Datasets)

大规模数据的可视化探索中存在着两个互相矛盾的需求:表达能力和计算效率。近来提出的一些方法,比如Nanocubes和imMens,使得大数据集上的实时交互探索成为可能。然而,它们支持的分析种类有限,只能快速得到直方图和heatmaps等。为了改善这一情况,文章提出了Gaussian Cubes,可以对数据进行交互式地建模,包括线性最小二乘法,主成分分析等。

与基于data cubes的方法不同,在它们的基础上,除了预先计算数据子集的数量 (count),Gaussian Cubes还提前计算了数据子集的多元高斯分布,这使得它能够在一秒内对具有百万点的数据拟合数百个模型。

继续阅读 »