
在高维数据分析中,聚类(Clustering)与降维(Dimension Reduction)都是常用的机器学习方法。前者尝试对数据进行归纳分类,而后者则试图压缩维度并尽可能地保留分布信息。可视分析往往结合两者的优点,以帮助用户更好地挖掘数据隐含的信息。在具体应用中,我们应该如何挑选聚类和降维方法呢?两者的结合都有哪些因素需要考虑,又有哪几种不同的方案呢?这篇发表于IEEE VAST 2017的文章[1] 便系统地探讨了这些问题。
如今移动物体的轨迹数据在多个领域被广泛的收集,如动物生态学,运动以及航空。移动物体的相似轨迹的聚类是运动分析中的重要技术。可以使用距离函数基于轨迹点或段的属性来评估轨迹之间的相似性。属性可能包括空间位置,时间和其他数据属性。有这样的需求,需要分析轨迹的某些部分,即具有特定属性的点和段。根据分析焦点,需要对轨迹的相关部分进行聚类。在整个分析过程中,焦点可能会改变,轨迹的不同部分可能会变得相关。这篇文章[1]提出一个分析工作流程,其中使用交互式过滤工具将相关标志附加到轨迹点,聚类是使用忽略不相关元素的距离函数完成的,并且汇总了所得到的聚类进一步分析。
该工作有三个主要的工作流程,分别为过滤,聚类和汇总分析。 继续阅读 »
集合(ensemble)模拟数据可视化是科学可视化的一个重要研究方向,特别是针对气象学这一特定领域。通过扰动初始条件或者使用不同的预测模型公式,集合方法会生成代表大气未来可能状态的一些数据成员。分析集合预报中的时间演化和可变性是这类问题的一个重要的任务。在已有的方法中,spaghetti plots (意大利面条图)是一种比较常用的分析气象标量场集合数据中等高线(iso-contour)的变化的方法。具体来讲,对于每个时间步,都有一个spaghetti plot展示某一iso-value下所有集合成员的等高线,这些spaghetti plots往往并列放置。如果需要看其动态演变,则需要通过动画的方式。但是,由于用户需要感知大量的视觉信息,动画很难建立连续时间步下等高线之间的关联。针对这一问题,今年的SciVis上提出了一种新的方法,可以分析集合天气预报数据中等高线的时空演变[1]。
近期评论