标签存档: 并行处理

在大规模多元众核系统上进行的针对体绘制的混合并行 (Hybrid Parallelism for Volume Rendering on Large-, Multi-, and Many-Core Systems)

随着芯片上计算核数量的增长,许多HPC协会的人开始担心至今在单核的大规模并行系统上运行良好的并行编程语言,模型和执行框架会面临越来越小的收益。于是这篇文章探索了一种叫做光线投射体绘制的常用可视化算法在不同的并行编程模型上操作并且在六核CPU组成的大规模超级计算机和多核GPU集群上运行的性能和可扩展性。本文比较了一种传统的单纯基于消息传递的分布式内存操作和一种混合操作,这种混合操作混合了芯片之间的消息传递和CPU或GPU内部的共享内存并行。我们希望验证的是在混合内存操作中,在芯片内部使用共享内存并行可以增强性能和可扩展性。

继续阅读 »

基于GPU的多级聚类 (GPU-Based Multilevel Clustering)

在许多应用尤其是数据分析中,我们经常会遇到大规模数据集聚类的任务,在大的多边形表面网格问题中,这个任务显得更为重要,因为目前的3D模型采集系统提供多达上百万种的表面模型。在聚类问题中,通常最常用到的两种方法是k-means聚类算法和分层方法,然而这两种方法都有一些缺点,这会严重影响他们的性能。这篇文章提出了一种在GPU上单独实施的针对网格聚类的框架。这种框架主要的算法元素是基于边界的查询,它的主要算法优势是多极方面内在地解决了初始化问题,由此提供了具有鲁棒性和高质量的聚类结果,其次,这种算法适用于任何全局数据结构。

继续阅读 »