月度存档: 十月 2019

多视图多类别散点图的利用集合覆盖优化的数据采样 (Data Sampling in Multi-view and Multi-class Scatterplots via Set Cover Optimization)

对高维数据进行可视化,一个常用的方法是散点图。对于具有2个以上维度的数据,可以使用散点图矩阵(scatterplot matrix, SPLOM),其中每一个视图是某2个维度的散点图。随着数据量的增加,在散点图中可能出现点的重叠问题(overdrawing),影响后续的分析。有许多方法用来缓解这种问题,比如调整散点图中的符号(marker),改变它的大小、透明度、位置等;使用密度图;进行数据采样等。本文提出了一种在散点图矩阵中对多类别数据进行多视图联合优化的数据采样方法。

继续阅读 »

特征乐高:一种使用穷举聚类进行超体素聚类的体数据探索方式(FeatureLego: Volume Exploration Using Exhaustive Clustering of Super-Voxels)

对于体数据的探索十分困难。一方面,体数据中蕴含着丰富的特征,探索过程中容易有所遗漏。另一方面,体数据中又充斥着噪声和用户不感兴趣的区域,需要精心进行特征的提取和筛选。对于体数据进行基于特征选择的探索方式通常基于体素聚类。在以往的工作中,交互式地聚类方式,需要用户对于聚类边界进行细致的调整,给用户带了巨大的负担。而由此衍生的多重聚类(Multiple Clustering),则通过对于聚类算法超参数的采样,获取尽可能多的聚类结果。而在此过程中,需要大量的试错式的尝试,才能得到良好的参数采样才能得到最终良好的聚类结果,同时由于采样的问题,特征的提取可能不够穷尽而导致有所遗漏。本文提出了一种基于穷举聚类的体素聚类方式,其命名而“特征乐高”,因为其在探索过程中能够提供给用户穷尽的特征聚类结果,就像基本的积木一样,用户可以有效的进行特征选择,加以组合,最终生成定制化的体数据可视化结果。

继续阅读 »

用于探索,监视和预测道路交通拥堵的可视化分析系统(A Visual Analytics System for Exploring, Monitoring, and Forecasting Road Traffic Congestion)

拥堵是城市交通最普遍的现象,确定拥堵的原因是城市规划中的主要问题。由于交通数据量大且复杂,分析和监视拥塞很困难。 例如,监视大量的监视摄像机是困难的,并且可能会丢失可能影响不久的交通状况的重要信息(例如,非法停车,车辆事故)。 因此,需要一种系统可以监视来自多个源的各种流数据并集成此信息以进行实时拥塞监视,预测和回顾性分析。该工作[1]结合LSTM模型进行拥堵预测,对大面积区域进行实时拥堵监控,预测和分析。

继续阅读 »

The What-If Tool: 机器学习模型的交互式探测(The What-If Tool: Interactive Probing of Machine Learning Models)

在这个可解释的机器学习时代,仅仅进行模型训练并从中获得预测的结果已经无法让人感到信服。 为了能够真正获得良好的结果,我们还应该能够探究我们的模型。探究一个模型需要问很多问题,例如探测模型中的问题和矛盾,这样的任务通常是复杂的并且需要编写大量的自定义代码。What-If Tool [1] 这个工具能够轻松、准确地解决这个问题,使它更容易为平常的用户来探究、评估和调试他们的机器学习系统。

继续阅读 »

R-Map: 一种基于地图隐喻的社交媒体信息转发可视化方法

我们提出了转发地图(R-Map),一种基于地图隐喻的社交媒体信息转发的可视化方法。该方法利用地图上不同的元素编码转发信息的不同特征,通过该方法及系统,能够直观的展示出一条社交媒体信息的转发结构、用户在转发过程中的角色以及转发过程中语义的变化。

继续阅读 »

EmoCo: 视频中的情感一致性可视化分析 (Visual Analysis of Emotion Coherence in Presentation Videos)

在人们的日常交流中,情感扮演了重要的角色。情感的表达可以通过多种方式,如表情、声音、文字、肢体动作等。人们会通过同时利用多种表现方式来传递自己的情感,然而有时这些方式所传递的信息并不是一致的。该工作[1]通过利用视频中讲者的表情、文字、声音,来分析讲者在这个三个通道上情感表达方式的特征,从而帮助学习者提示自己的演讲技巧。

继续阅读 »

基于像素的可视化技术的理论与应用(Designing Pixel-Oriented Visualization Techniques: Theory and Applications)

可视化大规模的高维数据在数据分析中扮演着越来越重要的角色。在众多的技术中,基于像素的可视化是一类非常有效的可视化方法。基于像素的可视化方法是在将对象的每一个数据属性映射到有限的屏幕空间内的一个像素点上,从而可视化尽可能多的可视化数据对象,并且通过排列像素点体现出数据中所存在的模式。近些年来,基于像素的可视化技术在很多具体场景中得到了广泛的应用并且充分验证了方法的有效性。本文的主要目的是讨论基于像素的可视化技术中的常见问题,对于设计该类可视化方法提供理论依据,本文所采用的方法是将基于像素的可视化技术中的设计转换为约束条件,求解约束条件进而得到设计决策,本文发现基于求解约束所得到的设计决策能够得到高效的可视化设计方法。 继续阅读 »