作者存档: Yun Han

ChinaVis 2018 – Day 3 (2018年7月28日)

历时三天的ChinaVis 2018最后一天的会议内容同样充实精彩,包括特邀报告,Panel讨论环节,专题报告,以及闭幕式。

继续阅读 »

ChinaVis 2018 – Day 1 (2018年7月26日)

第五届中国可视化与可视分析大会(ChinaVis 2018)于2018年7月26日在上海隆重开幕。大会为期三天,从2018年7月26日至7月28日举办,邀请了国内外可视化领域知名专家就相关研究与应用的最新进展作大会报告、介绍发展动态、开拓研究思路。会议包含了论文报告、海报张贴、Panel研讨、专题报告、可视化艺术展等丰富多彩的日程。大会由中国图象图形学学会主办,可视化与可视分析专委会、华东师范大学计算机科学与软件工程学院承办,同济大学、上海交通大学和多家赞助单位协办。本次会议吸引了来自101家高校与企事业单位、13家国外高校与企业的500多位专家学者参会。会议开幕式前一天,在华东师范大学还举办了前导课程,由美国俄亥俄州立大学的沈汉威教授和清华大学的刘世霞教授为大家分别介绍“数据分析与可视化信息理论”和“可解释机器学习”,课程得到了大家的积极参与,参加人数高达两百多人次。

继续阅读 »

另一视角:类比让数字更易理解

作为外行人,往往对于一些领域的数值可能很难理解,特别是当它们的数量级很大或者包含一些不熟悉的单位的时候。之前的很多种工作表明,从另外一个”视角”出发,对于这些测量结果采用比率、排序或单位变化,用一种更为直观的方式可以提高人们对于不熟悉的数值的理解能力。但是往往会有很多不同的”视角”。在本文中[1],通过对于超过1000名受试者的随机实验,系统地测试了影响不同”视角”表示方式质量的因素,发现”视角”对数值理解有长期的帮助。

继续阅读 »

T-Cal: 通过基于日历的可视化了解团队的对话数据

了解团队沟通和协作模式对于提高组织中的工作效率至关重要,于是基于团队对话数据的分析和探索是迫切需要的。但是这些数据通常是大量的包含了多种多样的信息,而且往往有多个线程对话同时进行。特别地,这些数据往往将消息及其答复捆绑在一起。因此从这些杂乱的数据中探索和分析存在很大的挑战。本文提出了一种交互式可视化系统T-Cal [1],它支持从团队消息传递平台(例如Slack)分析对话数据。 T-Cal采用用户熟悉的可视化界面和日历,可以从不同的角度多尺度浏览数据。 T-Cal还采用了许多分析技术来解开对话交错,提取关键词和情绪分析等等。

继续阅读 »

EVA: 可视分析用于识别欺诈事件

金融机构需要为他们的客户确保安全和质量,如银行需要及时识别和阻止有害的交易。 为了检测欺诈操作,通常使用数据挖掘技术和客户画像分析,但是这些方法目前还没有得到可视分析的支持。 然而可视分析技术可以帮助增强知识发现的过程,并提高欺诈事件探测系统检测和预测的准确性。因此,这篇文章提出了EVA,一种用于欺诈交易的可视化分析方法,将自动算法与可视分析相结合,提高系统检测的准确性。

继续阅读 »

可视化与可视分析专业委员会12月23日在北京成立

2017年12月23日,中国图象图形学学会可视化与可视分析专业委员会在北京正式成立。中国图象图形学会副理事长,北京大学汪国平教授和学会秘书长,清华大学马惠敏副教授作为学会代表参加了成立大会。

上午开幕仪式上,中国图象图形学会副理事长,北京大学汪国平教授代表学会作了讲话,转达了学会对可视化与可视分析专业委员会的期待和大力支持。大会特邀嘉宾,可视化研究领域的两位前辈前辈,国防科技大学李思昆教授和北京大学董士海教授回顾了中国可视化的发展历程,并表达了对专委会成立的殷切期望。北京大学袁晓如研究员代表专委会筹备组回顾了近十年来国内可视化领域的发展历程,介绍了半年多来可视化与可视分析专委会的筹备过程。

继续阅读 »

CrystalBall: 对于社交媒体数据进行未来事件识别和分析的可视分析系统 (CrystalBall: A Visual Analytic System for Future Event Discovery and Analysis from Social Media Data)

社交媒体数据可以为世界各地发生的事件提供宝贵的见解,且事件本质上是时间和空间的。现有的文本可视分析系统专注于探测和分析过去和正在进行的事件,很少有人利用社交媒体信息来寻找未来可能发生的事件。在本文中,我们提出了一个交互式可视化分析系统CrystalBall,它可以自动识别和排列来自Twitter的未来事件。 CrystalBall集成了新的方法,通过交互式可视化发现事件,从而可以识别未来事件。该方法利用有关的时间,地点,社交网络和消息,整合了七种不同的方法来识别和表征未来事件。同时,可视化界面与计算方法紧密结合以提供未来可能事件的简明摘要。

继续阅读 »

PhenoLines: 通过主题模型来对疾病亚型的症状进行比较可视化(PhenoLines: Phenotype Comparison Visualizations for Disease Subtyping via Topic Models)

主题模型主要用于对文档集的主题探究,也有不少的工作将主题模型应用到医学领域,但是目前的工作主要专注于提取特定患者的事件并将其可视化。基于这个层面,用户很难从中得到病症是如何随着时间发展和演变的,也难以理解这些症状的层次结构。因此,这篇文章[1]从一个新的视角,将主题模型输出的非结构化的结果用层次结构表示,并使用时间轴来比较和解释主题内和主题之间症状随时间的演变。

继续阅读 »

cite2vec: 基于词嵌入模型的引用文档研究 (cite2vec: Citation-Driven Document Exploration via Word Embeddings)

目前而言,对于文档集的探究,主要有以下三个方面的目标:

  1. 对文档集的概览,了解文档集中的主题等。
  2. 能够让用户探究感兴趣的文档集。
  3. 提供对于文档之间的比较功能。

然而,在进行文档集探究之前,我们首先需要选择一个适当的方式来“表示”文档集,这对于文档探究是十分重要的。在之前的文档集探究方法中,大多致力于将文档可视化来说明文档集是什么,也就是通过可视化的方式了解文档的内容。然而,这篇文章[1]从一个全新的视角,通过文档间的引用关系来将文档可视化,进而说明文档集的用途。

继续阅读 »

ConceptVector: 基于词嵌入的交互式词典构建进行文本可视分析 (ConceptVector: Text Visual Analytics via Interactive Lexicon Building using Word Embedding)

目前而言,许多文本分析方法的核心都是一个Concept:一组表征特定对象、现象或主题的语义相关的关键词。另外,Word Embedding的不断发展允许用户通过一小部分的关键词来构建一个Concept。然而,由于自然语言的多义性,直接使用这种技术可能导致错误。为了降低这个问题,这篇文章[1]提出了一个名为ConceptVector的可视分析系统,来指导用户构建这些Concepts,然后使用它们来分析文档。这篇文章使用现实生活中的数据集来进行案例分析,展示了ConceptVector的细粒度分析。为了支持这个“种子关键词”的概念,他们引用了双极概念模型,并且支持不相关的单词。

文本可视分析中涵盖了很多领域的方法:1. 词关系与层次结构;2. Word Embedding;3.基于单词层次的文本可视分析。

继续阅读 »