分类存档: 论文报告

面向自动化的信息图设计:基于深度学习的可扩展时间线自动生成(Towards Automated Infographic Design: Deep Learning-based Auto-Extraction of Extensible Timeline)

在创建信息图(Infographic)时,不仅要考虑视觉元素有效性,还要考虑设计美学、趣味性,对普通用户来说门槛较高。为了方便用户进行信息图设计,目前已经出现一些自动化的设计工具,但仍存在两个方面的问题:第一,模板风格单一,用户只能将数据导入模板,缺乏设计的多样性,如Microsoft PowerPoint和Adobe Illustrator等,用户定制性较差;第二,用户常常在网上搜索自己喜爱的信息图,以寻找设计灵感,但这些图片一般是位图(Bitmap)格式,用户如果想借鉴该图片的风格,还需要重新手动绘制,过程十分麻烦和枯燥。因此,从位图中自动提取可以编辑的模板用于新数据的创作,是有实际需求和价值的。

继续阅读 »

基于深度生成模型的图布局算法(A Deep Generative Model for Graph Layout)

在日常生活中,我们经常用图来表示社交网络等复杂的系统。在图的可视化中,点边图是最直观也是最常用的形式,不同的图布局能够展现同一个图的不同方面,找到一个好的图布局是图可视化中至关重要的任务。对于用户特别是新手来说,经典的图布局算法需要消耗大量的时间,来不断地调整参数以达到理想的图布局。本文[1]提出了一种深度生成模型,基于用经典布局算法获得的图布局数据,训练一个变分编解码器,其中编码器将图布局编码到一个二维的隐空间中,解码器从隐空间中重构出布局,这样的隐空间可以方便用户在二维平面上探索和生成各种布局。

继续阅读 »

Origraph:交互式网络整理(Origraph: Interactive Network Wrangling)

在可视化领域网络数据的探索是十分普遍的,比如社交媒体中的一些网络分析,也因此存在一系列的可视化形式和系统。但是很少有工作关注最初网络模型的构建。事实上,网络分析所基于的源数据通常是从在线数据源爬取的,基本形式是一系列的数据项和它们的属性,也就是表格数据的形式。依据不同的假设,我们可以从数据中抽象出不同的网络模型。为了探索不同的网络模型,我们需要通过编程将数据转换为我们需要的网络数据,而这样一个过程是繁琐低效的。

现有的网络整理工具中最著名的是Ploceus[1]和Orion[2],主要聚焦于初始网络模型的创建。但它们不能通过结点和边的相互转换等操作迭代和交互地重构网络模型的网络整理工具。而其它支持的操作,比如基于连接性的过滤,只能通过编程进行实现。 因此,该文章[3]提出交互式的可视化网络整理工具Origraph (见图1),在已有工具的基础上对网络模型的操作集合进行扩展,帮助用户快速有效地创建和修改网络模型。

继续阅读 »

通过协同语义推理与深度学习模型可视交互(Visual Interaction with Deep Learning Models through Collaborative Semantic Inference)

深度学习模型近年来扮演着重要的角色。它能够拟合非常复杂的函数从而实现许多任务。但是训练过程、训练的结果往往只是扮演了黑盒的角色——用户无法对其进行解释、也难以操纵训练的结果。如果用户对模型的输出不满意,很难设置模型以达到用户想要的结果。

近年来有许多文章对深度学习模型进行交互探索以打开深度模型。以往的方法中通常是观察模型产生的结果或者是探索输入与模型参数之间的关系。这类方法可以帮助用户找到输入数据中有问题的数据,以重新指导训练过程。但是对于如何对模型改进产生满意的结果鲜有涉及。Gehrmann 等人[1]在IEEE TVCG 2020(VAST 2019)发表了一篇通过协同语义推理(Collaborative Semantic Inference, CSI)与深度学习模型进行可视交互的文章。这篇文章介绍了协同语义推理的优越性——可以对模型产生直接的影响。

继续阅读 »

基于射线代理分布的大规模时变体数据探索(Ray-based Exploration of Large Time-varying Volume Data Using Per-ray Proxy Distributions)

对如今超级计算机上模拟产生的大规模时变体数据进行分析和可视化是一项非常艰巨的挑战,因为超级计算机可以产生具有极高时间和空间分辨率的数据集。网络传输和储存设备的有限带宽使得将整个数据集移动到数据分析机进行分析是不可行的。常见的解决方法之一是保持原始空间分辨率的同时降低时间采样率,但简单地在相邻采样时间步间进行插值会造成很大的误差。光线投射(Ray Casting)算法是直接体渲染(Direct Volume Rendering)的一种经典常用的方法。本工作提出了一种基于光线的表示方法,储存基于光线的直方图及深度信息,用以恢复采样时间步间的体数据渲染结果的信息,从而达到压缩原始数据的目的。

继续阅读 »

学术实体的影响花朵 (Influence Flowers of Academic Entities)

对学术实体影响的分析可以帮助人们更好地了解一个实体在学术界的生产力和声誉,并了解知识的创造过程。但已有的工作大多致力于影响力的量化。本文[1]提出了一种名为影响花朵(Influence Flower)的新的隐喻形式,能够展示实体之间影响的流动。

继续阅读 »

流式多维数据可视化的增量降维方法(An Incremental Dimensionality Reduction Method for Visualizing Streaming Multidimensional Data)

降维方法常用于多维数据的分析和可视化。然而,由于(1)高计算复杂度,(2)无法在不同时间步的降维结果中保留用户的心理地图和(3)无法处理数据包含不同维数的情况这三个挑战,降维方法无法直接应用到流式多维数据中。本文[1]介绍了一种增量式降维方法来解决这些挑战,使得用户能够实时可视化和分析流式多维数据。

继续阅读 »

GUIRO: 用户引导的矩阵重排序 (User-Guided Matrix Reordering)

矩阵可视化是主要的关系(或网络)数据可视化技术之一。如果其布局能够揭示底层的数据拓扑结构,则最为有效。不同的矩阵排序算法带来不同的视觉模式,它们的可信赖性和可解释性是个值得研究的问题。 该工作[1]介绍了一种可视化分析系统来帮助新手、网络分析师和算法设计人员打开排序算法黑匣子,从而帮助用户更好地了解复杂的重排序过程,进而支持数据和重排序算法的见解。

继续阅读 »

多视图多类别散点图的利用集合覆盖优化的数据采样 (Data Sampling in Multi-view and Multi-class Scatterplots via Set Cover Optimization)

对高维数据进行可视化,一个常用的方法是散点图。对于具有2个以上维度的数据,可以使用散点图矩阵(scatterplot matrix, SPLOM),其中每一个视图是某2个维度的散点图。随着数据量的增加,在散点图中可能出现点的重叠问题(overdrawing),影响后续的分析。有许多方法用来缓解这种问题,比如调整散点图中的符号(marker),改变它的大小、透明度、位置等;使用密度图;进行数据采样等。本文提出了一种在散点图矩阵中对多类别数据进行多视图联合优化的数据采样方法。

继续阅读 »

特征乐高:一种使用穷举聚类进行超体素聚类的体数据探索方式(FeatureLego: Volume Exploration Using Exhaustive Clustering of Super-Voxels)

对于体数据的探索十分困难。一方面,体数据中蕴含着丰富的特征,探索过程中容易有所遗漏。另一方面,体数据中又充斥着噪声和用户不感兴趣的区域,需要精心进行特征的提取和筛选。对于体数据进行基于特征选择的探索方式通常基于体素聚类。在以往的工作中,交互式地聚类方式,需要用户对于聚类边界进行细致的调整,给用户带了巨大的负担。而由此衍生的多重聚类(Multiple Clustering),则通过对于聚类算法超参数的采样,获取尽可能多的聚类结果。而在此过程中,需要大量的试错式的尝试,才能得到良好的参数采样才能得到最终良好的聚类结果,同时由于采样的问题,特征的提取可能不够穷尽而导致有所遗漏。本文提出了一种基于穷举聚类的体素聚类方式,其命名而“特征乐高”,因为其在探索过程中能够提供给用户穷尽的特征聚类结果,就像基本的积木一样,用户可以有效的进行特征选择,加以组合,最终生成定制化的体数据可视化结果。

继续阅读 »