使用长短期记忆模型学习并行粒子追踪里的数据访问模式 (Access Pattern Learning with Long Short-Term Memory for Parallel Particle Tracing)

粒子追踪是流场可视化与分析里最重要的技术之一,被大量应用在场线渲染、源汇查询、有限时间李雅普诺夫指数计算等应用中。然而,在大规模流场中,对大量粒子通过粒子追踪算法计算轨迹时,由于粒子访问数据块的局部性很差,导致计算过程中有大量时间消耗在数据块的读入上。一种提高数据块访问效率的做法,就是对粒子将要访问的数据块进行预测,然后提前进行预读取,从而将读入花费隐藏在计算时间之下。这个工作首次引入了深度学习模型,即基于长短期记忆 (Long Short-Term Memory, LSTM) 的模型,对粒子轨迹进行建模,从而能更为准确地预测粒子对数据块的访问,从而提高大规模粒子追踪算法的效率。

为了将粒子轨迹转换为深度学习模型容易处理的数据,我们需要对其进行变换。首先,粒子轨迹的坐标序列被转化为粒子所访问数据块的序列。采用数据块而不是坐标,是已有数据预读取工作常用的做法,并且直接预测坐标容易在数据块边界附近出现错误。接下来,数据块序列被转换为相对移动的序列,即表现粒子如何在数据块之间穿行。图1中,以蓝色粒子为例,展示了这个转换过程,也就是相邻两个数据块的索引求差。为了保证转换后的移动序列和原本的数据块序列等价,我们在序列最前面加上粒子的初始数据块,并加上字母S区分。这样就完成了粒子轨迹数据的转换工作。这种转换的另一个好处是,深度学习的模型能学习到间接的访问模式。例如,图1中黄色、绿色粒子尽管初始数据块不同,但具有类似的旋转行为,因而在转换后的序列中具有相同的子序列。我们的模型能够学习到这种模式,并应用到其他粒子的行为预测中去,而已有的工作则不能。

图1:粒子轨迹数据到移动序列数据的转换

图1:粒子轨迹数据到移动序列数据的转换

接下来,我们围绕LSTM构建深度学习模型,如图2所示。在这里,我们仅介绍模型的输入输出关系,细节部分请参阅论文以及相关深度学习资料。总起来看,我们的输入是粒子的移动序列s0, s1, …, s_{n-1},其中s0是粒子初始数据块索引。模型输出则是对应下一步移动的概率分布P0, P1,…,P_{n-1}。最初,模型接受s0为输入,对粒子的第1步进行预测,得到其在各种移动可能性上的概率分布P0。接着,模型又接受s1为输入,对粒子的第2步进行预测,得到其在各种移动可能性上的概率分布P1。需要注意地是,由于LSTM模型的性质,s0也参与到了P1的生成中。以此类推,粒子每一步移动的预测均由其之前所有访问的数据块序列来决定。

图2:基于LSTM的深度学习模型

图2:基于LSTM的深度学习模型

为了训练这个模型,我们从原始流场数据中采样一些较低精度的粒子轨迹,进行数据转换,作为训练集,选择超参数进行模型训练。文中对训练集大小以及超参数的选择与预测精度的关系进行了探索。

接着,基于这个训练好的模型,我们将其部署在GPU上,为并行粒子追踪算法提供粒子数据块访问的预测功能。粒子追踪器通过提前的数据块预取,来提高运行效率。在我们的性能测试中,我们选用了三个数据集:飓风伊莎贝尔、GEOS-5大气模拟和海洋模拟数据集。测试的布种策略为局部分析和全局分析,即在局部区域密集撒种,以及在整个空间域均匀撒种。在测试中,我们的方法与不带预取的方法以及使用高阶访问模式[2]进行预取的基准方法进行对比。

图3:在三个数据集上局部分析的性能测试结果

图3:在三个数据集上局部分析的性能测试结果

图3展示了在三个数据的局部分析中,两种基准方法,以及我们的方法在不同预取数时的性能对比。相比较于不带预取的方法,我们的方法有很大的性能提升。而相比较于使用高阶访问模式[2]进行预取的方法,我们的方法性能略高。在其他两个数据中也有类似的表现。而在全局分析中,相比较于不带预取的方法,我们的方法仍然具有很大的性能提升。而相比较于使用高阶访问模式[2]进行预取的方法,我们的方法性能略低一些。

需要注意的是,尽管我们的方法和高阶访问模式的方法性能基本接近,但我们的方法所需要的额外存储要远远小于高阶访问模式的存储,并且所需要的训练样本数目也更加少。例如对于飓风伊莎贝尔数据,我们的模型仅占用53MB,而4阶高阶访问依赖关系需要5.7GB,6阶更是需要20GB,比原数据更大。如果要求高阶访问依赖关系仅使用与我们方法相同的额外存储空间,那么它的性能将会变得非常差。另一方面,我们的方法仅需要100多万的粒子进行训练,而高阶访问依赖关系要数倍于此。

总的来说,我们的这篇工作首次采用了深度学习的技术来解决流场可视化中的粒子追踪问题。相比于已有工作,我们的方法能取得与已有方法相当的准确率和性能提升,并且只需要极小的额外存储和训练样本。

[1] Access Pattern Learning with Long Short-Term Memory for Parallel Particle Tracing. Fan Hong, Jiang Zhang, and Xiaoru Yuan. In Proceedings of IEEE Pacific Visualization Symposium (PacificVis 2018), Kobe, Japan, Apr. 10-13, 2018.

[2] Efficient Unsteady Flow Visualization with High-Order Access Dependencies. Jiang Zhang, Hanqi Guo, and Xiaoru Yuan. In Proceedings of IEEE Pacific Visualization Symposium (PacificVis 2016), pages 80-87, Taipei, Apr. 19-22, 2016.

评论关闭。