月度存档: 十二月 2017

Keshif: 提供可视化初学者快速有表现力的表格数据探索 (Keshif: Rapid and Expressive Tabular Data Exploration for Novices)

现有的一些交互式可视化设计环境,一般针对的是通用的可视化环境,强调强大的表达能力。用户需要手动定义可视化和交互。这样就造成用户学习这类工具的开销较大,探索数据的速度减缓等问题并且可视化初学者容易选择低效甚至错误的可视化映射。

继续阅读 »

气泡树图对不确定性的可视化(Bubble Treemaps for Uncertainty Visualization)

本文[1]提出了一个新的圆形树图类型,故意分配额外的视觉变量的额外空间。有了这个扩展的可视化设计空间,对分层结构数据及其组合图中的不确定性进行编码。本文引入一个分层和基于力的圆填充算法来计算气泡图,其中每个节点使用嵌套轮廓圆弧的可视化。气泡图不需要任何颜色或底纹,以提供更多的设计选择。本文探讨的不确定性可视化作为一个应用程序,使用标准误差图和蒙特卡洛的统计模型。为此,本文将讨论不确定性如何在层次结构中传播。此外,本文用三个不同的例子说明了我们的可视化的有效性:Flare的包装结构、标准普尔500指数和美国消费者支出调查。

继续阅读 »

CrystalBall: 对于社交媒体数据进行未来事件识别和分析的可视分析系统 (CrystalBall: A Visual Analytic System for Future Event Discovery and Analysis from Social Media Data)

社交媒体数据可以为世界各地发生的事件提供宝贵的见解,且事件本质上是时间和空间的。现有的文本可视分析系统专注于探测和分析过去和正在进行的事件,很少有人利用社交媒体信息来寻找未来可能发生的事件。在本文中,我们提出了一个交互式可视化分析系统CrystalBall,它可以自动识别和排列来自Twitter的未来事件。 CrystalBall集成了新的方法,通过交互式可视化发现事件,从而可以识别未来事件。该方法利用有关的时间,地点,社交网络和消息,整合了七种不同的方法来识别和表征未来事件。同时,可视化界面与计算方法紧密结合以提供未来可能事件的简明摘要。

继续阅读 »

在异步协同式意义构建场景下使用知识传输图传递知识(Supporting Handoff in Asynchronous Collaborative Sensemaking Using Knowledge-Transfer Graphs)

在数据分析中,将知识和发现通过可视化的方式展现出来可以帮助分析者追踪、组织、综合自己的发现和问题。当分析者互相合作时,通过互相交流,这些可视化形式能够帮助分析者互相理解自己的发现,这被称为协同式意义构建(Collaborative Sensemaking)。然而在复杂场景下,如何在合作者之间明确的传递知识(Tranfer of Knowledge/Handoff) 仍然是一个挑战。在异步合作场景下,分析者由于时空限制或者隐私考虑等不能够直接见面或者交流,前一个分析者需要将自己的发现传递给下一个分析者,但是少有的分析系统能够满足这样的需求。本文提出了一系列可视化加护技术帮助异步合作者之间有效传递发现、知识。

继续阅读 »

基于规则,聚类以及选择的多变量事件序列的探索(Exploring Multivariate Event Sequences using Rules, Aggregations, and Selections)

事件序列类型的数据在现实生活中广泛存在,比如通信过程中传递的数据包,医院中病人的看病流程,商场中用户的购买记录等等。在通常情况下,对于事件序列进行分析用到的属性非常有限,包括时间属性以及事件类型,然而对于某些数据分析任务,必须要结合对于事件对象的多变量分析。本文所针对的问题即为多变量的事件序列数据的探索[1], 将正则表达式扩展到事件序列的基础上,提出基于规则,聚类以及选择的多变量事件序列的探索流程,并且在此基础上开发了多变量事件序列的可视分析系统,本文通过对于通话数据以及病人看病流程数据的探索验证了系统的有效性。

继续阅读 »

分析深度生成模型的训练过程 (Analyzing the Training Processes of Deep Generative Models)

DGMTracker系统界面

深度生成模型是针对非监督学习和半监督学习的一种强有力的解决方案。通过深度生成模型,深度学习在没有外部数据标签或者带标签数据集过小的情况下仍然能继续工作。与其他的深度模型,比如卷积神经网络,更强有力的深度生成模型,也意味着其训练过程对训练者的要求更高。一方面,生成模型既有着确定性的函数,又包含随机变量;另一方面,生成模型是一种自上而下不断生成细节的过程,而诸如卷积神经网络则是从细节中不断提取高层特征的自底向上的过程。综合这两方面,如果理解深度生成模型的训练过程,以及如何对其过程进行诊断就变得尤其重要。本文就考虑用可视分析的手段来帮着这个分析过程。

继续阅读 »