分类存档: 未分类

RuleMatrix:使用规则可视化和理解分类器 (RuleMatrix: Visualizing and Understanding Classifiers with Rules)

随着机器学习技术的日益普及,人们对使机器学习系统更加透明和可解释的研究兴趣激增。研究者们已经开发了各种可视化以帮助模型开发者理解,诊断和改进机器学习模型。然而,大量潜在但被忽视的用户是领域专家,他们对机器学习知之甚少,但预计会与机器学习系统一起工作。本文作者提出了一种交互式可视化技术,以帮助在机器学习方面缺乏专业知识的用户理解,探索和验证预测模型。通过将模型视为黑盒子,作者从其输入 – 输出行为中提取标准化的基于规则的知识表示。然后,作者设计了RuleMatrix,基于矩阵的规则可视化,以帮助用户导航和验证规则和黑盒模型。作者通过两个用例和一个可用性研究来评估RuleMatrix的有效性。

继续阅读 »

使用长短期记忆模型学习并行粒子追踪里的数据访问模式 (Access Pattern Learning with Long Short-Term Memory for Parallel Particle Tracing)

粒子追踪是流场可视化与分析里最重要的技术之一,被大量应用在场线渲染、源汇查询、有限时间李雅普诺夫指数计算等应用中。然而,在大规模流场中,对大量粒子通过粒子追踪算法计算轨迹时,由于粒子访问数据块的局部性很差,导致计算过程中有大量时间消耗在数据块的读入上。一种提高数据块访问效率的做法,就是对粒子将要访问的数据块进行预测,然后提前进行预读取,从而将读入花费隐藏在计算时间之下。这个工作首次引入了深度学习模型,即基于长短期记忆 (Long Short-Term Memory, LSTM) 的模型,对粒子轨迹进行建模,从而能更为准确地预测粒子对数据块的访问,从而提高大规模粒子追踪算法的效率。

继续阅读 »

将基本的D3图标转化为可重用的风格模板(Converting Basic D3 Charts into Reusable Style Templates)

这篇工作介绍一种将基本D3图表转换为可重用样式模板的技术。给定一个新的数据源,这篇工作应用样式模板来生成一个描述新数据的图表。为了构造样式模板,这篇工作首先解构D3图表中的:数据,标记和数据的映射。然后,这篇工作对解构出的映射的做感知有效性进行排序。要将生成的样式模板应用于新的数据源这篇工作们首先要获取每个新数据字段的重要性等级。然后,这篇工作调整模板映射以通过将最重要的数据字段与最感知有效的映射进行匹配来描述源数据。这篇工作展示了样式模板如何以数据表格或其他D3图表的形式应用于源数据。虽然这篇工作的实现侧重于为基本图表类型(例如条形图,折线图,点图,散点图等)生成模板,但这些是当前最常用的图表类型。用户可以很容易地在Web上找到这些基本的D3图表,将它们变成模板,并立即看到他们自己的数据在模板的视觉样式(例如颜色,形状,字体等)中的外观。这篇工作通过将多样化的样式模板应用到各种源数据集来证明这篇工作方法的有效性[3]。

继续阅读 »

在2D+时间轨迹上评估对时间和速度的感知(Assessing the Graphical Perception of Time and Speed on 2D+Time Trajectories)

时序数据在历史,气象,金融,地理,运动等许多领域都很普遍。文献中有许多在2D路径上进行时间和/或速度编码的研究,经常使用的视觉变量有大小,色彩亮度和段长度等。 然而到目前为止还没有研究来评估这些可视编码的相对可解释性。该工作[1]实验性地评估了人们在2D路径上感知非恒定时间和速度的程度。 在该图形感知研究中,作者评估了文献中所存在的关于直线和曲线路径上映射时间和/或速度的九种编码。 当x和y轴已经编码其他数据维度时,例如位置信息,在此基础上可视化时间和速度信息是一个挑战。 该研究成果为InfoVis设计人员提供了在2D路径上进行时间和/或速度编码的指导方针。其中,作者建议尽可能使用颜色值来编码速度和路径的分段长度来编码时间。

继续阅读 »

气泡树图对不确定性的可视化(Bubble Treemaps for Uncertainty Visualization)

本文[1]提出了一个新的圆形树图类型,故意分配额外的视觉变量的额外空间。有了这个扩展的可视化设计空间,对分层结构数据及其组合图中的不确定性进行编码。本文引入一个分层和基于力的圆填充算法来计算气泡图,其中每个节点使用嵌套轮廓圆弧的可视化。气泡图不需要任何颜色或底纹,以提供更多的设计选择。本文探讨的不确定性可视化作为一个应用程序,使用标准误差图和蒙特卡洛的统计模型。为此,本文将讨论不确定性如何在层次结构中传播。此外,本文用三个不同的例子说明了我们的可视化的有效性:Flare的包装结构、标准普尔500指数和美国消费者支出调查。

继续阅读 »

用于在大规模并行应用程序中优化通信的可视分析系统 (A Visual Analytics System for Optimizing Communications in Massively Parallel Applications)

近年来,超级计算机被广泛应用于诸如气候和分子动力学模拟等大规模并行应用程序中。这些超级计算机往往包含大规模的计算结点,结点之间通过复杂的通信网络连接,例如5D torus或者dragonfly等。应用程序的计算任务被分配到各个计算结点,并且由这些结点协作完成。在这个过程中,结点之间的通信是非常关键的,在很大程度上影响着并行程序的可扩展性和并行效率。因此, 如何识别通信瓶颈并且对通信进行优化变得非常重要。造成通信瓶颈的原因有很多,例如通信路由比较长,通信网络上收发的信息量比较大等。研究者需要能够了解通信路由,减少通信网络拥堵。今年VAST会议上有一篇文章提出了一个可视分析系统,使用可视化方法对通信行为进行分析[1]。

继续阅读 »

MyBrush:可个人代理的交互刷选(MyBrush: Brushing and Linking with Personal Agency)

本文[1]通过在交互中加入个人代理,对流行的交互刷选技术进行了推广。将现有的交互刷选研究映射到一个设计空间,并把交互技术解构为三个部分:源(被刷选的对象),链接(源和目标之间的关系表达),和目标(显示源相关的是什么)。采用这种设计空间,本文创造了MyBrush,这是一个统一的接口,在交互刷选中提供个人代理,用户可以灵活配置多个刷的源,链接,和目标。三个焦点小组的实验结果表明,不同背景的人用不同的方式使用个人代理,包括执行复杂的任务和显式地显示链接。我们对这些结果进行了反思,为未来个人代理在信息可视化中的作用奠定了基础。

继续阅读 »

将视频和移动数据结合来增强体育运动分析(Bring it to the Pitch: Combining Video and Movement Data to Enhance Team Sport Analysis)

对体育比赛进行分析,可以观察球员或球队的战略和战术行为。当前的分析工作流通常基于人工观看比赛视频分析。但是观看视频通常是一个耗时的过程,分析人员需要记住和注释场景。这项工作将球队视频与轨迹数据的抽象可视化相结合来帮组我们理解 [1]。

继续阅读 »

延迟不确定性和其对火车旅行规划的影响的可视化(Visualization of Delay Uncertainty and its Impact on Train Trip Planning: A Design Study)

火车延误的不确定性对火车旅行具有很大的影响。延误可能导致转车时错过连接火车,或到达目的地比预约的时间要晚。面对这种不确定性,旅行者希望预先知道火车可能的延迟。目前,火车旅行规划是基于两站之间的预定的时间。虽然有几种可视化方法可以显示时间不确定性,但没有专门的视觉设计支持行程规划。对于这些问题,我们提出了一个评估视觉设计,延迟火车旅行规划与延迟不确定性可视分析系统。它列出了预定的火车线路连接,预期的火车延误以及它们对到达时间的影响以及错过转车的可能性[1]。

继续阅读 »

NEREx:多方会话中的实体关系探索(NEREx: Named-Entity Relationship Exploration in Multi-Party Conversations)

本文提出了NEREX,为逐字会话脚本提供了一种探索性的交互式可视化分析方法。NEREX的切入点是从多方对话不同的角度给出了分析,通过链接的详细视图提供高层次的概述和提供机制的形成和验证假设。使用定制命名实体抽取,我们将重要实体抽象为十类,并用距离约束实体关系模型提取它们之间的关系。该模型符合逐字记录往往不合语法的结构,涉及两个实体是否在同一个句子中出现一个小的距离窗内。我们的工具使多方对话的探索性分析使用几个链接的意见,显示在文本的主题和时间结构。除了远程阅读,我们还为文本层次调查过程整合了密切的阅读观点。超越时空对话的探索性分析,NEREX帮助用户生成和验证假设并进行多元对话的比较分析。我们通过三名来自政治科学领域专家的定性研究,证明了我们的方法在2016届美国总统辩论中对真实世界数据的适用性。

继续阅读 »