降维中的可视交互:一个结构化的文献分析 (Visual Interaction with Dimensionality Reduction: A Structured Literature Analysis)

降维是高维数据可视分析的一种重要的数据抽象技术。它将高维数据降解到低维空间,同时尽可能保留诸如异常点、聚类等特征。降维的方法林林总总,在可视分析中很难一步到位使用不需要任何适配的降维方法。常见的做法是通过交互的方式,将标准的降维方法适配到具体的应用场景中。目前在关于算法与可视交互如何融合方面,大多数工作是从高层次、抽象的角度来讨论其流程或模型[1][2]。本文[3]聚焦于降维这一特定方向,通过对文献进行半自动分析的方式,对降维中的可视交互进行结构化的文献调研。

作者采用如下图1所示的文献调研方法。首先,收集VIS以及EuroVis上包括长短文在内的所有文章,共1850篇。通过自然语言处理的方式,对这1850篇论文的全文进行关键词提取,同时从交互/降维的综述文章中提取有关交互/降维相关工作的主题词。将后者作为基准,按关键词对1850论文自动筛选,获得377篇相关文章。接着,作者对这377篇论文进行手动过滤、逐篇判断,获得70篇与降维交互相关的文章。在对70篇论文进行人工编码,即为每篇文章进行基本信息、交互场景、机器学习算法等多方面的注释。最后,通过验证这一步骤,对处于边界的论文进行判断,获得调研的58篇论文的完整集合。

pipeline

图1 半自动的文献调研方法

作者从这58篇论文中归纳出了7种交互场景。下图2显示了这7种交互在降维可视分析流程中参与的环节。其中S1,S2,S3是关于降维算法输入数据的交互:S1-输入数据的选择与强调,S2-数据操纵,S3-数据的标签,S4是降维算法中特征的选择与强调,S5,S6,S7分别是关于降维算法的参数、限制以及种类的交互。

model

图2 7种交互场景在降维可视分析流程中的融合情况

根据7种交互场景,作者将58篇论文的情况通过下表1表示。其中有四篇论文同时结合了4种应用交互场景(红色),有9篇文章在降维中融入了S4交互式指定特征的功能(蓝色),5篇文章允许S1更换输入的数据集(橙色)等。图3分别是从具体的降维方法和时间分布的角度看这7类交互场景的分布情况。从具体的降维方法的角度,基于距离以及线性投影这两类方法在7中交互上都有相关的研究(图3(a))。S1,S2,S4和S5这四种交互场景从2007年至今在许多工作中都有被用到(图3(b))。

chart

表1 58篇论文的交互场景分布情况

打印

图3 7类交互场景在:(a) 具体的降维方法和(b)时间分布的分布

本文还枚举了几个涉及降维的可视分析系统,例如StarSPIRE系统[4],支持用户选择输入关键词获得文章集S1,对文章打标签S2,调整各维度的权重S4以及修改力导向布局算法S6。

在已有工作的基础上,作者展望了几个在降维中融入交互的研究趋势,包括语义交互即通过直观的交互正确地反映分析的意图,对选择不同降维方法的指导等等。不同于以往高层次抽象的可视交互模型的讨论,本文将文献作为数据,通过半自动的调研方法完成结构化的综述。这种思路与今年VIS会议中的“从文章主题词透析VIS领域”这一篇文章相仿,都自底向上地将文献作为一种数据,通过半自动本人工的方式对文献进行整理、综述。关于另一篇文章的详细信息请移步这篇博文

参考文献:

[1] Sacha, D.; Stoffel, A.; Stoffel, F.; Kwon, B. C.; Ellis, G. & Keim, D. A.. Knowledge Generation Model for Visual Analytics.IEEE Transactions on Visualization and Computer Graphics, 2014, 20, 1604-1613

[2] Sacha, D.; Michael, S.; Zhang, L.; Lee, J. A.; Weiskopf, D.; North, S. & Keim, D. A.. Human-Centered Machine Learning Through Interactive Visualization: Review and Open Challenges. European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, 2016, 641-646

[3] Sacha, D.; Zhang, L.; Sedlmair, M.; Lee, J. A.; Peltonen, J.; Weiskopf, D.; North, S. C. & Keim, D. A..  Visual Interaction with Dimensionality Reduction: A Structured Literature Analysis. IEEE Transactions on Visualization and Computer Graphics, 2017, 23, 241-250

[4] Bradel, L.; North, C.; House, L. & Leman, S.. StarSpire: Multi-Model Semantic Interaction for Text Analytics. IEEE Conference on Visual Analytics Science and Technology (VAST), 2014, 1-10

评论关闭。