斯图加特大学博士后周亮访问北京大学

ping pi2017年4月12日,德国斯图加特大学可视化研究实验室(Visualisierungsinstitut, Universitaet Stuttgart (VISUS))博士后周亮访问北大可视化与可视分析实验室。周亮博士的研究方向包括大规模多属性数据的可视化与分析,交互式复杂数据特征提取。

访问期间,周亮博士就其近期工作作了题为《Indexed-Points Parallel Coordinates Visualization of Multivariate Correlations》的学术报告。该工作基于[1]提出了一种新的视觉映射(如图1),平面上的一条线通过式(1)变换成为平行坐标系中的一个点(1-flats),图1平行坐标系中x1轴左侧对应斜率a>1(x1与x2正相关),x1轴与x2轴之间a<0(x1与x2负相关),x2轴右侧0<a<1(x1与x2正相关)。对于任意满足线性关系的n维数据,都可以变换成为平行坐标系中的一个点。这样就可以在平行坐标系中直接显示多属性数据的线性关系,并且对于正相关和负相关关系有着很好的区分。3维数据的线性关系在空间中表现为平面,而当数据维度超过3,其含义难以确定,所以该工作只分析2个或者3个属性之间的相关性。fomula1

图1 二维直线映射到平行坐标系中点

如图2,在m维空间中做一个局部的线性拟合,在选定的邻域中做特征向量分析,找到最大的特征向量,其对应的是一维空间的线性关系,将其投影到平行坐标系中相邻的两维上可以得到m-1条直线,然后通过1-flats投影到平行坐标系中的点。如果选用最大的特征向量和第二大特征向量可以近似3个属性的关系,即创建了一个二维平面,然后通过2-flats投影到平面坐标系中的点。

图2 工作流程

下面以一个白酒数据分析了1-flats和2-flats。在图3(a)中,平行坐标系中被圈选的蓝色区域具有很强的正相关性(投影点位于坐标轴左侧),从对应的散点图中也可以看出酒精度(Alcohol)和密度(Density)具有正相关性,酒精度越大密度越小(注:这里对酒精度轴y反转处理);而左侧的黄色区域具有负相关性(投影带你位于坐标轴之间),从对应的散点图中可以看出固定酸度(Fixed Acidity)越大,PH值越小。

图3 白酒数据

在2-flats分析中,在图3(b)被圈选的蓝色区域可以看到密度,酒精度,残糖(Residual Sugar)三个属性具有很强相关性,近似在一个平面上,这也可以从右下角的散点图矩阵得到验证。而红色区域的chlorldes, sulphates, free sulfur dioxide也有着很强的线性相关性。

该工作已经被收录到TVCG中,将于近期发表。报告后,实验室同学与周亮博士就该工作进行了热烈的讨论。

20170412photo4

图4 周亮博士作报告

访问期间,周亮博士还参观了实验室相关工作在大屏幕上的演示,陈帅同学介绍了关于社交媒体可视分析的一系列工作,叶唐陟同学演示了轨迹可视化相关工作。周亮博士与师生关于大屏幕交互、展示以及相关工作进行了深入讨论交流。

图5 周亮博士与实验室师生以及来自北邮的李铁萌老师合影(左二)

[1] Inselberg A. Parallel coordinates. Springer US; 2009.

评论关闭。