分类存档: 论文报告

通过协同语义推理与深度学习模型可视交互(Visual Interaction with Deep Learning Models through Collaborative Semantic Inference)

深度学习模型近年来扮演着重要的角色。它能够拟合非常复杂的函数从而实现许多任务。但是训练过程、训练的结果往往只是扮演了黑盒的角色——用户无法对其进行解释、也难以操纵训练的结果。如果用户对模型的输出不满意,很难设置模型以达到用户想要的结果。

近年来有许多文章对深度学习模型进行交互探索以打开深度模型。以往的方法中通常是观察模型产生的结果或者是探索输入与模型参数之间的关系。这类方法可以帮助用户找到输入数据中有问题的数据,以重新指导训练过程。但是对于如何对模型改进产生满意的结果鲜有涉及。Gehrmann 等人[1]在IEEE TVCG 2020(VAST 2019)发表了一篇通过协同语义推理(Collaborative Semantic Inference, CSI)与深度学习模型进行可视交互的文章。这篇文章介绍了协同语义推理的优越性——可以对模型产生直接的影响。

继续阅读 »

基于射线代理分布的大规模时变体数据探索(Ray-based Exploration of Large Time-varying Volume Data Using Per-ray Proxy Distributions)

对如今超级计算机上模拟产生的大规模时变体数据进行分析和可视化是一项非常艰巨的挑战,因为超级计算机可以产生具有极高时间和空间分辨率的数据集。网络传输和储存设备的有限带宽使得将整个数据集移动到数据分析机进行分析是不可行的。常见的解决方法之一是保持原始空间分辨率的同时降低时间采样率,但简单地在相邻采样时间步间进行插值会造成很大的误差。光线投射(Ray Casting)算法是直接体渲染(Direct Volume Rendering)的一种经典常用的方法。本工作提出了一种基于光线的表示方法,储存基于光线的直方图及深度信息,用以恢复采样时间步间的体数据渲染结果的信息,从而达到压缩原始数据的目的。

继续阅读 »

学术实体的影响花朵 (Influence Flowers of Academic Entities)

对学术实体影响的分析可以帮助人们更好地了解一个实体在学术界的生产力和声誉,并了解知识的创造过程。但已有的工作大多致力于影响力的量化。本文[1]提出了一种名为影响花朵(Influence Flower)的新的隐喻形式,能够展示实体之间影响的流动。

继续阅读 »

流式多维数据可视化的增量降维方法(An Incremental Dimensionality Reduction Method for Visualizing Streaming Multidimensional Data)

降维方法常用于多维数据的分析和可视化。然而,由于(1)高计算复杂度,(2)无法在不同时间步的降维结果中保留用户的心理地图和(3)无法处理数据包含不同维数的情况这三个挑战,降维方法无法直接应用到流式多维数据中。本文[1]介绍了一种增量式降维方法来解决这些挑战,使得用户能够实时可视化和分析流式多维数据。

继续阅读 »

GUIRO: 用户引导的矩阵重排序 (User-Guided Matrix Reordering)

矩阵可视化是主要的关系(或网络)数据可视化技术之一。如果其布局能够揭示底层的数据拓扑结构,则最为有效。不同的矩阵排序算法带来不同的视觉模式,它们的可信赖性和可解释性是个值得研究的问题。 该工作[1]介绍了一种可视化分析系统来帮助新手、网络分析师和算法设计人员打开排序算法黑匣子,从而帮助用户更好地了解复杂的重排序过程,进而支持数据和重排序算法的见解。

继续阅读 »

多视图多类别散点图的利用集合覆盖优化的数据采样 (Data Sampling in Multi-view and Multi-class Scatterplots via Set Cover Optimization)

对高维数据进行可视化,一个常用的方法是散点图。对于具有2个以上维度的数据,可以使用散点图矩阵(scatterplot matrix, SPLOM),其中每一个视图是某2个维度的散点图。随着数据量的增加,在散点图中可能出现点的重叠问题(overdrawing),影响后续的分析。有许多方法用来缓解这种问题,比如调整散点图中的符号(marker),改变它的大小、透明度、位置等;使用密度图;进行数据采样等。本文提出了一种在散点图矩阵中对多类别数据进行多视图联合优化的数据采样方法。

继续阅读 »

特征乐高:一种使用穷举聚类进行超体素聚类的体数据探索方式(FeatureLego: Volume Exploration Using Exhaustive Clustering of Super-Voxels)

对于体数据的探索十分困难。一方面,体数据中蕴含着丰富的特征,探索过程中容易有所遗漏。另一方面,体数据中又充斥着噪声和用户不感兴趣的区域,需要精心进行特征的提取和筛选。对于体数据进行基于特征选择的探索方式通常基于体素聚类。在以往的工作中,交互式地聚类方式,需要用户对于聚类边界进行细致的调整,给用户带了巨大的负担。而由此衍生的多重聚类(Multiple Clustering),则通过对于聚类算法超参数的采样,获取尽可能多的聚类结果。而在此过程中,需要大量的试错式的尝试,才能得到良好的参数采样才能得到最终良好的聚类结果,同时由于采样的问题,特征的提取可能不够穷尽而导致有所遗漏。本文提出了一种基于穷举聚类的体素聚类方式,其命名而“特征乐高”,因为其在探索过程中能够提供给用户穷尽的特征聚类结果,就像基本的积木一样,用户可以有效的进行特征选择,加以组合,最终生成定制化的体数据可视化结果。

继续阅读 »

The What-If Tool: 机器学习模型的交互式探测(The What-If Tool: Interactive Probing of Machine Learning Models)

在这个可解释的机器学习时代,仅仅进行模型训练并从中获得预测的结果已经无法让人感到信服。 为了能够真正获得良好的结果,我们还应该能够探究我们的模型。探究一个模型需要问很多问题,例如探测模型中的问题和矛盾,这样的任务通常是复杂的并且需要编写大量的自定义代码。What-If Tool [1] 这个工具能够轻松、准确地解决这个问题,使它更容易为平常的用户来探究、评估和调试他们的机器学习系统。

继续阅读 »

EmoCo: 视频中的情感一致性可视化分析 (Visual Analysis of Emotion Coherence in Presentation Videos)

在人们的日常交流中,情感扮演了重要的角色。情感的表达可以通过多种方式,如表情、声音、文字、肢体动作等。人们会通过同时利用多种表现方式来传递自己的情感,然而有时这些方式所传递的信息并不是一致的。该工作[1]通过利用视频中讲者的表情、文字、声音,来分析讲者在这个三个通道上情感表达方式的特征,从而帮助学习者提示自己的演讲技巧。

继续阅读 »

基于像素的可视化技术的理论与应用(Designing Pixel-Oriented Visualization Techniques: Theory and Applications)

可视化大规模的高维数据在数据分析中扮演着越来越重要的角色。在众多的技术中,基于像素的可视化是一类非常有效的可视化方法。基于像素的可视化方法是在将对象的每一个数据属性映射到有限的屏幕空间内的一个像素点上,从而可视化尽可能多的可视化数据对象,并且通过排列像素点体现出数据中所存在的模式。近些年来,基于像素的可视化技术在很多具体场景中得到了广泛的应用并且充分验证了方法的有效性。本文的主要目的是讨论基于像素的可视化技术中的常见问题,对于设计该类可视化方法提供理论依据,本文所采用的方法是将基于像素的可视化技术中的设计转换为约束条件,求解约束条件进而得到设计决策,本文发现基于求解约束所得到的设计决策能够得到高效的可视化设计方法。 继续阅读 »