月度存档: 一月 2018

Map-based Graph Visualization

地图形式的图可视化方式指将图中的社群用一段连续的区域表示,不同的社群构成了地图上不同的“国家”。这样的可视化方式既可以提高可视化美观度,吸引用户花更多的时间探索数据[1];又可以增强用户的对可视化内容的记忆,更准确回忆自己的发现结果[2]。

继续阅读 »

Podium:用混合驱动的可视分析对数据排序(Podium: Ranking Data Using Mixed-Initiative Visual Analytics)

对数据进行排序是数据分析中基础的操作之一。人们使用排序来理解大数据集中最重要的元素、根据数据属性进行决策、或者给原本没有排名的数据增加排名以表达某种含义。例如,人们会按照统计数据给球队排名,会根据电影的特性或者票房给电影排序等等。人们也会将一些排名和自己的认识进行对比,例如球队的粉丝可能希望理解专家发布的排名是基于什么样的准则。

继续阅读 »

西藏拉萨中学师生参观北大可视化与可视分析实验室

2018年1月4日,来自西藏拉萨中学的2名老师、10名学生以及正在拉萨中学支教的北京大学第十九届研究生支教团西藏分团的4名志愿者同学,来到北京大学可视化与可视分析实验室参观。志愿者中有一位是我们实验室的硕士生田敏同学。

继续阅读 »

EVA: 可视分析用于识别欺诈事件

金融机构需要为他们的客户确保安全和质量,如银行需要及时识别和阻止有害的交易。 为了检测欺诈操作,通常使用数据挖掘技术和客户画像分析,但是这些方法目前还没有得到可视分析的支持。 然而可视分析技术可以帮助增强知识发现的过程,并提高欺诈事件探测系统检测和预测的准确性。因此,这篇文章提出了EVA,一种用于欺诈交易的可视化分析方法,将自动算法与可视分析相结合,提高系统检测的准确性。

继续阅读 »

对TensorFlow中数据流图的可视分析(Visualizing Dataflow Graphs of Deep Learning Models in TensorFlow)

对TensorFlow中数据流图的可视分析

TensorFlow是谷歌开发的、当下最流行的机器学习软件库之一。它采用数据流图(Dataflow Graph)来表达机器学习算法的计算过程,用户可以定制不同的数据流图来构建自己的算法。然而,随着深度学习的兴起与流行,各类神经网络渐趋大规模、复杂化。算法开发者仅凭借自身的理解与记忆、很难把握算法的各部分体系结构,相互之间也难以进行沟通。为此,这篇文章[1]提出了可视化工具TensorFlow Graph Visualizer,通过可视分析帮助用户在TensorFlow中进行算法分析与开发。值得一提的是,该文章荣获了IEEE VAST 2017的最佳论文奖(Best Paper Award)。

继续阅读 »

在可视分析中系统地结合降维投影与聚类方法(Towards a Systematic Combination of Dimension Reduction and Clustering in Visual Analytics)

在可视分析中系统地结合降维投影与聚类方法

在高维数据分析中,聚类(Clustering)与降维(Dimension Reduction)都是常用的机器学习方法。前者尝试对数据进行归纳分类,而后者则试图压缩维度并尽可能地保留分布信息。可视分析往往结合两者的优点,以帮助用户更好地挖掘数据隐含的信息。在具体应用中,我们应该如何挑选聚类和降维方法呢?两者的结合都有哪些因素需要考虑,又有哪几种不同的方案呢?这篇发表于IEEE VAST 2017的文章[1] 便系统地探讨了这些问题。

继续阅读 »