
在这个可解释的机器学习时代,仅仅进行模型训练并从中获得预测的结果已经无法让人感到信服。 为了能够真正获得良好的结果,我们还应该能够探究我们的模型。探究一个模型需要问很多问题,例如探测模型中的问题和矛盾,这样的任务通常是复杂的并且需要编写大量的自定义代码。What-If Tool [1] 这个工具能够轻松、准确地解决这个问题,使它更容易为平常的用户来探究、评估和调试他们的机器学习系统。
图1:电影Jurassic Park和The Moon and Sixpence的故事线可视化: (a)和 (b)为手绘版本, (c)和 (d)为iStoryline绘制的版本; (e)和(f)为StoryFlow自动生成的版本.
故事线可视化技术(storyline visualization techniques)在自动生成复杂故事对应的插图这方面取得了显著进展。虽然其性能有所提升,应用领域得到扩展,但是故事线的视觉布局没有因此得到增强。现有方法的优化目标包括减少空白空间、最小化线条交叉和摆动等。然而,与手绘的故事线相比,追求这些优化目标并不能产生最佳的结果,会产生布局重复、情节缺失等问题。为解决这些问题,作者实现了iStoryline工具,通过将用户的交互集成到自动生成技术的优化算法中,在手绘故事线和自动布局之间实现平衡。
由于缺乏构建在创造性的视觉表达的同时,提供支持将图形内容绑定到数据的工具,创建异想天开的个人数据可视化仍然是一个挑战。许多数据分析和可视化创建工具的目标是可视化表示的快速生成,但缺乏图形设计所必需的功能。工具包和制图库提供了更多的表达能力,但需要专家编程技巧来实现定制设计。相反,素描以自由形式的方式提供流体实验与视觉形状和布局,但需要手动绘制每一个数据点。我们的目标是弥合这些极端之间的差距。本文[1]提出了DataInk,一个支持通过直接笔和触摸输入的严格直接操作来创建表达性数据的可视化系统。利用我们常规的操作,再加上一个新颖的图形用户界面,DataInk使创造性数据可视化的直接、流畅和灵活的创作成为可能。
本文提出了NEREX,为逐字会话脚本提供了一种探索性的交互式可视化分析方法。NEREX的切入点是从多方对话不同的角度给出了分析,通过链接的详细视图提供高层次的概述和提供机制的形成和验证假设。使用定制命名实体抽取,我们将重要实体抽象为十类,并用距离约束实体关系模型提取它们之间的关系。该模型符合逐字记录往往不合语法的结构,涉及两个实体是否在同一个句子中出现一个小的距离窗内。我们的工具使多方对话的探索性分析使用几个链接的意见,显示在文本的主题和时间结构。除了远程阅读,我们还为文本层次调查过程整合了密切的阅读观点。超越时空对话的探索性分析,NEREX帮助用户生成和验证假设并进行多元对话的比较分析。我们通过三名来自政治科学领域专家的定性研究,证明了我们的方法在2016届美国总统辩论中对真实世界数据的适用性。
目前的可视分析系统提供的刷选联动操作多是定性的,即在一个视图中任意刷选,在其他视图中高亮对应数据进行联动。这种刷选联动方式,一方面很难重现一个自由的刷选操作。另一方面,高亮的联动方式不支持定量分析。而本文[1]对刷选-联动方式进行拓展,提出面向量化可视分析的结构化刷选和统计联动的新颖的交互设计。 继续阅读 »
在许多领域如医学、社会科学以及商业分析领域中,群体指的是一群具有相似特征的对象。在这些领域中,有大量的针对群体的研究。例如,在医学领域,有大量的电子医疗记录,领域专家们常常需要找到满足一定医疗记录的群体,从而进行发病特征或疾病预测等分析。然而,从大量的个体中,要查询获得满足一定时序条件的群体并不直接。使用传统的查询语言来描述时序关系不仅繁琐、易错。同时,由于此类系统不能动态地返回查询结果,按照这种方式查询的结果常常要么过大、要么过小,不能灵活地帮助领域专家对查询条件进行调整。本文作者旨在提出一种直观的渐进式视觉查询设计,通过自然的交互方式以及动态的查询结果反馈机制,更好地帮助领域专家查询符合时序条件的群簇[1]。
当人们在使用一个软件的人机交互过程中,用户的心理分析过程对软件的界面与交互设计有很重要的启发意义。
本文[1]利用用户使用软件INVISQUE(INteractive Visual Search and QUery Environment)时的心理过程,来帮助改善用户界面与用户交互。具体地,本文使用心理决策理论—DFM模型(Data-Frame Model)来分析用户使用INVISQUE时的心理过程。DFM模型如图1所示,DFM模型共有四个模块。 1)连接到知识帧(Connecting data to frame);2)细化知识帧(Elaborating the frame);3)质疑知识帧(Questioning the frame);4)更改知识帧(Re-framing)。
近期评论