作者存档: Yun Han

The What-If Tool: 机器学习模型的交互式探测(The What-If Tool: Interactive Probing of Machine Learning Models)

在这个可解释的机器学习时代,仅仅进行模型训练并从中获得预测的结果已经无法让人感到信服。 为了能够真正获得良好的结果,我们还应该能够探究我们的模型。探究一个模型需要问很多问题,例如探测模型中的问题和矛盾,这样的任务通常是复杂的并且需要编写大量的自定义代码。What-If Tool [1] 这个工具能够轻松、准确地解决这个问题,使它更容易为平常的用户来探究、评估和调试他们的机器学习系统。

继续阅读 »

AILA:基于 Attention 的深度神经网络进行文本类别标注 (AILA: Attentive Interactive Labeling Assistant for Document Classification through Attention-based Deep Neural Networks)

文本分类(Text Classification)已经运用到越来越多的自然语言处理任务(Natural Langurage Processing,NLP)上,如垃圾邮件检测(Span Detection), 假新闻过滤(Fake news filtering),情感分析(Sentiment Analysis)等等。基于深度学习的这类任务都需要大量的标注数据,然而标注是一个十分耗时耗力的过程,需要标注者长时间的注意力。特别地,对于一些特定领域的数据,如法律、医学等等,更要求标注者有着一定的专业知识。如果系统能够自动的高亮出文本中对于文本类别影响较大的关键词可以一定程度上减轻标注者的任务。

继续阅读 »

PacificVis 2019 – Day 2

4月24日是 PacificVis 2019 正式日程的第一天,首先进行的是大会的开幕式。本次大会的会议主席教授向各位与会者表示热烈的欢迎,随后介绍了本次会议的参与情况。今年是第十二届 PacificVis 会议,接着,论文、短文的主席分别对各自部分的参与、评审以及接收情况进行了介绍。本次会议共接受全文24篇,短文12篇。实验室洪帆同学的论文《DNN-VolVis: Interactive Volume Visualization Supported by Deep Neural Network》被全文接收。

继续阅读 »

用卷积神经网络来评估图形感知能力

卷积神经网络(Convolution Neural Network,CNN)已经在许多计算机视觉(Computer Vision)任务上取得了成功。 对于可视化,CNN 可以怎么应用于图形感知任务? 这篇文章 [1] 通过复制 Cleveland 和 McGill 的1984年的开创性实验 [2] 来研究这个问题,该实验测量了不同视觉编码的人类感知效率,并定义了可视化的基本感知任务。 我们在五种不同的可视化任务上测量了四种网络架构的图形感知功能,并与现有人的感知能力进行比较。 虽然在有限的情况下 CNN 能够达到或超越人工任务表现,但我们发现 CNN 目前还不是人类图形感知的良好模型。 我们提供这些实验的结果,以促进理解 CNN 在应用于数据可视化时的成功和失败。

继续阅读 »

灵活文档:通过上下文可视化链接文本和表格数据来帮助文档阅读

数据丰富的文档本身就是复杂的数据集,它们由不同格式的信息组成,如文本,图形和数据表。这些额外的信息形式更有利于我们对文档中的文本叙述的理解。但是,传统的打印文档的静态布局通常会妨碍对其内容的深入理解,因为这些信息往往分散各个部分。在本文中[1],我们寻求通过将文本内容与文档中包含的数据表格相结合的上下文可视化技术来促进对这些文档的更好理解。我们解析文本内容和数据表格,使用基于关键字的匹配算法来链接这两部分,并根据读者在文档中的当前关注点来生成可视化。

继续阅读 »

ChinaVis 2018 – Day 3 (2018年7月28日)

历时三天的ChinaVis 2018最后一天的会议内容同样充实精彩,包括特邀报告,Panel讨论环节,专题报告,以及闭幕式。

继续阅读 »

ChinaVis 2018 – Day 1 (2018年7月26日)

第五届中国可视化与可视分析大会(ChinaVis 2018)于2018年7月26日在上海隆重开幕。大会为期三天,从2018年7月26日至7月28日举办,邀请了国内外可视化领域知名专家就相关研究与应用的最新进展作大会报告、介绍发展动态、开拓研究思路。会议包含了论文报告、海报张贴、Panel研讨、专题报告、可视化艺术展等丰富多彩的日程。大会由中国图象图形学学会主办,可视化与可视分析专委会、华东师范大学计算机科学与软件工程学院承办,同济大学、上海交通大学和多家赞助单位协办。本次会议吸引了来自101家高校与企事业单位、13家国外高校与企业的500多位专家学者参会。会议开幕式前一天,在华东师范大学还举办了前导课程,由美国俄亥俄州立大学的沈汉威教授和清华大学的刘世霞教授为大家分别介绍“数据分析与可视化信息理论”和“可解释机器学习”,课程得到了大家的积极参与,参加人数高达两百多人次。

继续阅读 »

另一视角:类比让数字更易理解

作为外行人,往往对于一些领域的数值可能很难理解,特别是当它们的数量级很大或者包含一些不熟悉的单位的时候。之前的很多种工作表明,从另外一个”视角”出发,对于这些测量结果采用比率、排序或单位变化,用一种更为直观的方式可以提高人们对于不熟悉的数值的理解能力。但是往往会有很多不同的”视角”。在本文中[1],通过对于超过1000名受试者的随机实验,系统地测试了影响不同”视角”表示方式质量的因素,发现”视角”对数值理解有长期的帮助。

继续阅读 »

T-Cal: 通过基于日历的可视化了解团队的对话数据

了解团队沟通和协作模式对于提高组织中的工作效率至关重要,于是基于团队对话数据的分析和探索是迫切需要的。但是这些数据通常是大量的包含了多种多样的信息,而且往往有多个线程对话同时进行。特别地,这些数据往往将消息及其答复捆绑在一起。因此从这些杂乱的数据中探索和分析存在很大的挑战。本文提出了一种交互式可视化系统T-Cal [1],它支持从团队消息传递平台(例如Slack)分析对话数据。 T-Cal采用用户熟悉的可视化界面和日历,可以从不同的角度多尺度浏览数据。 T-Cal还采用了许多分析技术来解开对话交错,提取关键词和情绪分析等等。

继续阅读 »

EVA: 可视分析用于识别欺诈事件

金融机构需要为他们的客户确保安全和质量,如银行需要及时识别和阻止有害的交易。 为了检测欺诈操作,通常使用数据挖掘技术和客户画像分析,但是这些方法目前还没有得到可视分析的支持。 然而可视分析技术可以帮助增强知识发现的过程,并提高欺诈事件探测系统检测和预测的准确性。因此,这篇文章提出了EVA,一种用于欺诈交易的可视化分析方法,将自动算法与可视分析相结合,提高系统检测的准确性。

继续阅读 »