标签存档: 大规模数据

基于像素的可视化技术的理论与应用(Designing Pixel-Oriented Visualization Techniques: Theory and Applications)

可视化大规模的高维数据在数据分析中扮演着越来越重要的角色。在众多的技术中,基于像素的可视化是一类非常有效的可视化方法。基于像素的可视化方法是在将对象的每一个数据属性映射到有限的屏幕空间内的一个像素点上,从而可视化尽可能多的可视化数据对象,并且通过排列像素点体现出数据中所存在的模式。近些年来,基于像素的可视化技术在很多具体场景中得到了广泛的应用并且充分验证了方法的有效性。本文的主要目的是讨论基于像素的可视化技术中的常见问题,对于设计该类可视化方法提供理论依据,本文所采用的方法是将基于像素的可视化技术中的设计转换为约束条件,求解约束条件进而得到设计决策,本文发现基于求解约束所得到的设计决策能够得到高效的可视化设计方法。 继续阅读 »

时间格:支持交互式可视分析大规模时间序列的数据结构(Time Lattice: A Data Structure for the Interactive Visual Analysis of Large Time Series)

物联网设备的广泛使用生成了大量的时间序列数据,通常会有几十至几千的传感器同时生成时间序列。交互式的可视化框架在分析这些数据时非常重要。进行分析时需要复杂的查询,包括在不同时间分辨率下对时间序列数据的取值进行限制,进行聚集等。

继续阅读 »

基于图像和分布的大规模数据体绘制 (Image and Distribution Based Volume Rendering for Large Data Sets)

随着高性能计算技术的发展,领域科学家可以使用超级计算机对一些物理现象进行建模,并进行高分辨率的模拟。通过对模拟输出结果进行可视化和分析,科学家可以对这些物理现象有更深入的理解。但是,由于数据规模的不断增大,网络和存储设备的有限带宽和容量成为了一个重要的瓶颈。针对这一问题,研究者提出了原位数据可视化和分析的方法。这种方法使用相同的超级计算机资源,可以在不用移动原始数据的情况下生成紧凑型的数据代理(proxy)。之后,用户只需要对这些数据代理在后处理机器上进行分析。这里面,一类有效的方法是基于图像的方法。通过预先选择几个有意义的视角,其可以从原始数据中生成图像用于后处理分析。然而,这些方法在使用传递函数发现和分析被遮挡特征真一方面的能力非常有限,并且产生的基于图像的代理也会造成不可避免的信息损失,加大了对数据进一步分析的复杂度。为了解决这个问题,今年PacificVis会议上的一篇文章[1]提出了一种基于图像和分布的大规模数据表示方法,将原始数据存储为基于图像的数据代理,可以在资源有限的后处理机器上进行传递函数探索,并对其中引入的误差进行量化和可视化。

继续阅读 »