分类存档: 论文报告 - 第2页

多视图多类别散点图的利用集合覆盖优化的数据采样 (Data Sampling in Multi-view and Multi-class Scatterplots via Set Cover Optimization)

对高维数据进行可视化,一个常用的方法是散点图。对于具有2个以上维度的数据,可以使用散点图矩阵(scatterplot matrix, SPLOM),其中每一个视图是某2个维度的散点图。随着数据量的增加,在散点图中可能出现点的重叠问题(overdrawing),影响后续的分析。有许多方法用来缓解这种问题,比如调整散点图中的符号(marker),改变它的大小、透明度、位置等;使用密度图;进行数据采样等。本文提出了一种在散点图矩阵中对多类别数据进行多视图联合优化的数据采样方法。

继续阅读 »

特征乐高:一种使用穷举聚类进行超体素聚类的体数据探索方式(FeatureLego: Volume Exploration Using Exhaustive Clustering of Super-Voxels)

对于体数据的探索十分困难。一方面,体数据中蕴含着丰富的特征,探索过程中容易有所遗漏。另一方面,体数据中又充斥着噪声和用户不感兴趣的区域,需要精心进行特征的提取和筛选。对于体数据进行基于特征选择的探索方式通常基于体素聚类。在以往的工作中,交互式地聚类方式,需要用户对于聚类边界进行细致的调整,给用户带了巨大的负担。而由此衍生的多重聚类(Multiple Clustering),则通过对于聚类算法超参数的采样,获取尽可能多的聚类结果。而在此过程中,需要大量的试错式的尝试,才能得到良好的参数采样才能得到最终良好的聚类结果,同时由于采样的问题,特征的提取可能不够穷尽而导致有所遗漏。本文提出了一种基于穷举聚类的体素聚类方式,其命名而“特征乐高”,因为其在探索过程中能够提供给用户穷尽的特征聚类结果,就像基本的积木一样,用户可以有效的进行特征选择,加以组合,最终生成定制化的体数据可视化结果。

继续阅读 »

The What-If Tool: 机器学习模型的交互式探测(The What-If Tool: Interactive Probing of Machine Learning Models)

在这个可解释的机器学习时代,仅仅进行模型训练并从中获得预测的结果已经无法让人感到信服。 为了能够真正获得良好的结果,我们还应该能够探究我们的模型。探究一个模型需要问很多问题,例如探测模型中的问题和矛盾,这样的任务通常是复杂的并且需要编写大量的自定义代码。What-If Tool [1] 这个工具能够轻松、准确地解决这个问题,使它更容易为平常的用户来探究、评估和调试他们的机器学习系统。

继续阅读 »

EmoCo: 视频中的情感一致性可视化分析 (Visual Analysis of Emotion Coherence in Presentation Videos)

在人们的日常交流中,情感扮演了重要的角色。情感的表达可以通过多种方式,如表情、声音、文字、肢体动作等。人们会通过同时利用多种表现方式来传递自己的情感,然而有时这些方式所传递的信息并不是一致的。该工作[1]通过利用视频中讲者的表情、文字、声音,来分析讲者在这个三个通道上情感表达方式的特征,从而帮助学习者提示自己的演讲技巧。

继续阅读 »

基于像素的可视化技术的理论与应用(Designing Pixel-Oriented Visualization Techniques: Theory and Applications)

可视化大规模的高维数据在数据分析中扮演着越来越重要的角色。在众多的技术中,基于像素的可视化是一类非常有效的可视化方法。基于像素的可视化方法是在将对象的每一个数据属性映射到有限的屏幕空间内的一个像素点上,从而可视化尽可能多的可视化数据对象,并且通过排列像素点体现出数据中所存在的模式。近些年来,基于像素的可视化技术在很多具体场景中得到了广泛的应用并且充分验证了方法的有效性。本文的主要目的是讨论基于像素的可视化技术中的常见问题,对于设计该类可视化方法提供理论依据,本文所采用的方法是将基于像素的可视化技术中的设计转换为约束条件,求解约束条件进而得到设计决策,本文发现基于求解约束所得到的设计决策能够得到高效的可视化设计方法。 继续阅读 »

Visual Boosting in Pixel-based Visualizations (基于像素的可视化中的视觉增强)

基于像素的可视化方法是针对每一个数据项仅使用很小的一个区域(若干个像素)进行视觉编码的一种可视化方法。在面对大规模数据集时,基于像素的可视化方法有较好的表现,可以提供高分辨率。然而同时也有其弊端,若数据较为稀疏,像素大小的数据项容易被人忽视,而若数据项较密集,紧密排布的像素数据点会掩盖潜在的数据特征。因此,视觉增强的方法被用来加强对基于像素的可视化的认知,常用的视觉增强方法有光轮、颜色、变形、影线、形状符号等。

继续阅读 »

P5: 针对交互式数据分析和可视化的便携渐进式并行处理流水线(P5: Portable Progressive Parallel Processing Pipelines for Interactive Data Analysis and Visualization)

交互式数据分析面临的数据,体量越来越大,复杂度越来越高,导致数据转换和可视化渲染的延迟提高,这将会阻碍用户交互分析的效率。现有的应对方式包括应用并行处理等方法提高计算速度,以及通过渐进式可视化方法,使用户能快速获得对中间结果的感知。但是大部分现有的可视化工具包,不能支持应用高性能计算方法,并且提供渐进式可视化创建的能力。该工作提供了P5这一创建渐进式可视化的可视化工具包,它提供了声明式的可视化生成方式和使用GPU计算资源的功能。

继续阅读 »

AILA:基于 Attention 的深度神经网络进行文本类别标注 (AILA: Attentive Interactive Labeling Assistant for Document Classification through Attention-based Deep Neural Networks)

文本分类(Text Classification)已经运用到越来越多的自然语言处理任务(Natural Langurage Processing,NLP)上,如垃圾邮件检测(Span Detection), 假新闻过滤(Fake news filtering),情感分析(Sentiment Analysis)等等。基于深度学习的这类任务都需要大量的标注数据,然而标注是一个十分耗时耗力的过程,需要标注者长时间的注意力。特别地,对于一些特定领域的数据,如法律、医学等等,更要求标注者有着一定的专业知识。如果系统能够自动的高亮出文本中对于文本类别影响较大的关键词可以一定程度上减轻标注者的任务。

继续阅读 »

比较苹果和橙子:表格数据中成对比较的分类和设计(Comparing Apples and Oranges: Taxonomy and Design of Pairwise Comparisons within Tabular Data)

成对比较问题很常见,它可以帮助我们进行类比推理、社会比较、决策以及知识发现。然而,我们经常是在比较苹果和橙子(compare apples and oranges——两个感兴趣的东西不易比较。比如比较北京和纽约,这两个城市在很多方面都有不同之处。本文 [1] 旨在系统地研究成对比较问题。作者们提出了成对比较的分类,开发了一个电子表格应用程序Duo以帮助人们完成成对比较。此外,他们还研究了用马虎规则(sloppy rules)和自然语言来指定成对比较问题的不同。

继续阅读 »

适用可扩展链接可视化的平衡交互级延迟及像素敏感性的系统(Falcon: Balancing Interactive Latency and Resolution Sensitivity for Scalable Linked Visualizations )

在ACM SIGCHI 2019 会议上,美国华盛顿大学交互数据实验室的 Moritz 等人(Jeffrey Heer 组)发表了关于针对大规模链接可视化的低延迟系统的文章。文章提出的系统 Falcon 可以平衡交互延迟和像素精度。结合数据索引,数据预取和渐进式交互等方法,Falcon 可以从查询和界面系统两方面一体式地对多视图链接可视化进行优化。

继续阅读 »