作者存档: Wu, Cong

多视图多类别散点图的利用集合覆盖优化的数据采样 (Data Sampling in Multi-view and Multi-class Scatterplots via Set Cover Optimization)

对高维数据进行可视化,一个常用的方法是散点图。对于具有2个以上维度的数据,可以使用散点图矩阵(scatterplot matrix, SPLOM),其中每一个视图是某2个维度的散点图。随着数据量的增加,在散点图中可能出现点的重叠问题(overdrawing),影响后续的分析。有许多方法用来缓解这种问题,比如调整散点图中的符号(marker),改变它的大小、透明度、位置等;使用密度图;进行数据采样等。本文提出了一种在散点图矩阵中对多类别数据进行多视图联合优化的数据采样方法。

继续阅读 »

用于交通数据预测的深度时空3维卷积神经网络 (Deep Spatial–Temporal 3D Convolutional Neural Networks for Traffic Data Forecasting)

在智能交通系统中,可靠的交通预测具有重要的意义,可以帮助决策者制定更好的管理策略,也可以帮助人们调整出行计划。但是,交通预测中存在一些挑战:

  • 空间相关性:相邻区域的交通数据具有一定的相关性
  • 时间相关性:相邻时间的交通数据具有一定的相关性
  • 异质性:不同地区和时间相关性的贡献并不相同

本文提出了一种基于深度学习的时空交通预测网络,ST-3DNet,用来解决时空网格数据预测问题。ST-3DNet结合了3维卷积和残差单元,提出了一种再校准模块来描述空间维度上相关性的不同贡献,并结合局部和长期的时间模式来达到较好的效果。

继续阅读 »

一种用于多类密度图的声明式渲染模型 (A Declarative Rendering Model for Multiclass Density Maps)

当数据点具有两个quantitative属性和一个categorical属性时,就可以用multiclass maps展示,包括散点图,多维投影,主题地图等。如果点的数量很多,直接绘制会引起overplotting,降低可读性,此时需要进行一些处理,比如alpha blending、数据聚集等,来保持可读性。本文展示了multiclass density maps,对每一种category都计算出2维的histogram,通过分块提高可视化的表达力和可扩展性。在总结相关工作的基础上,作者设计了一种模型,通过声明式的语法来进行multiclass density maps的可视化,并且可以动态调整来得到不同的可视化结果。

继续阅读 »

Gaussian Cubes: 在大规模多维数据的可视化探索中实时建模 (Gaussian Cubes: Real-Time Modeling for Visual Exploration of Large Multidimensional Datasets)

大规模数据的可视化探索中存在着两个互相矛盾的需求:表达能力和计算效率。近来提出的一些方法,比如Nanocubes和imMens,使得大数据集上的实时交互探索成为可能。然而,它们支持的分析种类有限,只能快速得到直方图和heatmaps等。为了改善这一情况,文章提出了Gaussian Cubes,可以对数据进行交互式地建模,包括线性最小二乘法,主成分分析等。

与基于data cubes的方法不同,在它们的基础上,除了预先计算数据子集的数量 (count),Gaussian Cubes还提前计算了数据子集的多元高斯分布,这使得它能够在一秒内对具有百万点的数据拟合数百个模型。

继续阅读 »