作者存档: Lu Feng

NEREx:多方会话中的实体关系探索(NEREx: Named-Entity Relationship Exploration in Multi-Party Conversations)

本文提出了NEREX,为逐字会话脚本提供了一种探索性的交互式可视化分析方法。NEREX的切入点是从多方对话不同的角度给出了分析,通过链接的详细视图提供高层次的概述和提供机制的形成和验证假设。使用定制命名实体抽取,我们将重要实体抽象为十类,并用距离约束实体关系模型提取它们之间的关系。该模型符合逐字记录往往不合语法的结构,涉及两个实体是否在同一个句子中出现一个小的距离窗内。我们的工具使多方对话的探索性分析使用几个链接的意见,显示在文本的主题和时间结构。除了远程阅读,我们还为文本层次调查过程整合了密切的阅读观点。超越时空对话的探索性分析,NEREX帮助用户生成和验证假设并进行多元对话的比较分析。我们通过三名来自政治科学领域专家的定性研究,证明了我们的方法在2016届美国总统辩论中对真实世界数据的适用性。

继续阅读 »

草图的语义:时间序列可视查询系统的灵活性 (The Semantics of Sketch: Flexibility In Visual Query Systems For Time Series Data)

草图允许分析者指定复杂和自由的兴趣模式。可视化查询系统可以利用草图在大型数据集中找到这些感兴趣的模式。然而,草图是不明确的:同一张图可能代表大量潜在的查询。在这项工作中,我们调查了这些含糊之处,因为它们适用于可视查询系统的时间序列数据。我们定义了一类“不变量”——分析者在执行基于草图的查询时希望忽略的时间序列的属性。我们提出了一个众包的研究结果,表明这些不变量是人们如何评价草图和目标之间的匹配强度的关键组成部分。我们采用了一些时间序列匹配算法来支持草图中的不变量。最后,依赖于这些不变量,我们提出了一个基于Web部署的草图可视化查询系统原型。我们将原型应用于金融、数字人文和政治科学的数据。

继续阅读 »

动物运动生态学的探索性视觉分析(Exploratory Visual Analysis for Animal Movement Ecology)

运动生态学家研究动物的运动,以帮助了解他们的行为和相互作用和环境。从GPS记录器的数据越来越重要。这些数据需要进行处理,分割和总结进一步的可视化和统计分析,往往使用预定义的参数。通常情况下,这个过程是分开的后续的视觉和统计分析,使这些结果很难通知数据处理,并帮助设置适当的规模和阈值参数。本文[1] 探讨了使用高度互动的视觉分析技术,处理原始数据和探索性的可视化分析之间的差距缩小。与动物运动生态学家密切合作,我们提出的要求,使数据的特点来确定,初步研究的问题进行调查,以及进一步分析的数据进行评估的适用性。我们设计的视觉编码和互动来满足这些要求而提供的软件实现。我们展示了这些技术与指示性的研究问题的一些鸟类,提供软件,并讨论更广泛的动物运动生态学的影响。

继续阅读 »

探索在常见可视化中嵌入异构数据属性的可能性(Exploring the Possibilities of Embedding Heterogeneous Data Attributes in Familiar Visualizations)

异构多维数据现在已经足够普遍,甚至可以被称为无处不在。目前最常见的可视化这些数据的方法就是提出新的可视化来表示这些数据。这些新的解决方案具有很强的创造性,但对于用户往往比较陌生。本文[1]探索扩展常见和熟悉的可视化,通过嵌入异构数据属性(HEDA),使熟悉的可视化能够显示更多信息。展示了如何开发一个通用的、交互式的可视化组件,可以对常见的可视化技术进行拓展的同时,尊重结构的熟悉布局。开发一个表格的可视化构建块,使个人通过对嵌入式多变量数据的操作,直观地观察、探索和查询其熟悉的可视化。本文通过探索在 D3 Gallery 里熟悉的可视化中应用 HEDA 来测试其应用空间,并能够基于属性的重新排序来实现数据查询。

继续阅读 »

PowerSet: 一种交叉集的综合性可视化(PowerSet: A Comprehensive Visualization of Set Intersections)

分析大量的数据时,分析人士经常将共享某些属性的数据元素归为一个集合。使用这些集合作为分析的单位,不仅降低了数据量,而且还便于检测到数据中的各种模式。这涉及到分析这些集合之间的交叉关系,以及这些交叉集之间的元素属性如何不同。由于集合的通用性和强大的概念,这种基于集合的分析在各种领域中有着不同的应用。然而,可视化集合间的交叉关系是具有挑战性的,因为它们的数量会随着集合数量呈指数增长,而且交叉集的表示大小和它们所包含的元素也不成比例。本文[1]提出了一种新的基于树图的技术,对非空交叉集提供一个全面的概览,具有较强的可拓展性。它可以观察到元素是如何分布在这些交叉集的,以及进行更细粒度的分析,探索和比较它们的属性。交互允许基于这些元素集成员进行查询和过滤。我们展示了如何使用我们的技术支持各种用例的数据探索和分析,提供基于集的数据的观察,超越了国家的最先进的技术的限制。

继续阅读 »

可视化演示:一种可视化数据探索的交互范式(Visualization by Demonstration: An Interaction Paradigm for Visual Data Exploration)

图片 1

图1. 可视化演示的工作流程

本文提出了可视化演示,这是可视化数据探索的一种新的交互方法。它可以独立使用或添加到现有的可视化工具。不同于直接的可视化规范,这种方法允许用户提供可视化表示增量变化的可视化演示。用户可以直接操作空间和图形的编码。然后,该系统基于给定的演示提出潜在转换的建议,它也提取了能够匹配给定演示的可视化映射和参数。由于它不需要用户提前指定可视化技术,它降低了可视化数据探索所需的基本知识水平。用户和系统继续合作,逐步产生更多的演示,然后提炼出转换方式。 继续阅读 »