月度存档: 十二月 2015

聚合集: 基于元素聚合的可拓展的集合探索 (AggreSet: Rich and Scalable Set Exploration using Visualizations of Element Aggregations)

Aggreset

集合数据是一种常见的数据,它以集合中元素作为属性。除了集合属性(set-typed attribute)之外,也可能存在着其他常规的属性。在集合数据中探索集合关系是此类数据的一个重要分析问题。但当集合数量变多、集合中元素增多,如何有效地探索这些集合关联是一个挑战。针对现有方法存在可拓展性不好,或针对特定的任务而设计,抑或将常规属性与集合属性区分,设计并不统一等问题,这篇论文设计了统一的、可拓展的集合探索可视化形式——AggreSet[1].

继续阅读 »

将每个时间步的图降维为点:动态网络可视化探索分析方法 (Reducing Snapshots to Points: A Visual Analytics Approach to Dynamic Network Exploration )

Reducing Snapshots to Points

目前,动态图可视分析方法主要分为small multiples和animation两大类。Small multiples方法,将时间映射到空间上,用户需要同时观察若干个snapshot,相互比较来获取差异。由于屏幕空间有限,当时间步很多时,很难同时展示出所有时刻的网络,且用户难以分析获取动态网络的变化模式。Animation方法,将时间映射到时间维度,用户在每个时刻只能观察到一个时间步的网络,需要去记忆,理解时间步之间网络的变化情况,进而理解动态图的变化模式。

本文提出一种新颖的方法,来分析动态图的变化模式。他们将每个时间步的网络转换成高维向量,将这些高维向量投影到二维平面,用点表示。如图1所示,投影后得到的布局中,每个点表示一个时间步的snapshot, 每条边连接了两个相邻时刻的顶点。这个方法可以有效地帮助用户探索分析动态图的稳定状态、重现状态、异常状态以及状态与状态之间的转移过程。
继续阅读 »

科学大数据可视化学术研讨会成功举办

科学大数据可视化学术研讨会于2015年12月19日在北京大学举办。来自国防科技大学、北京应用物理与计算数学研究所、天津大学、中科院网络中心、北京林业大学以及北京大学可视化与可视分析研究组的三十余人参加了这次学术研讨会。

李思昆教授介绍高性能与原位可视化

李思昆教授介绍高性能与原位可视化

继续阅读 »

时变集合模拟数据的有效可视化 (Effective Visualization of Temporal Ensembles)

图1:对于单个时间步粒子形态的可视化。左图包含八叉树的完整结构,右图仅包含八叉树中第四层的结构。

随着计算能力的不断提高,集合模拟 (ensemble) 数据已经被广泛应用于各类科学模拟中。从定义来说,一个集合模拟数据是一组紧密相关数据集的集合,每个数据集被称作“成员”,它们来自于同一次模拟或同一次试验的多次运行结果。通常集合模拟数据的分析难度巨大,既因为其数据量庞大,也因为其具有时变、高维、以及多变量的多重复杂性。本文提出了一系列的可视化分析方法来研究这类具有时变特征的集合模拟数据,尤其是其关注其所包含特征在各成员间的异同及演变过程。

继续阅读 »

英国帝国理工学院郭毅可教授访问北京大学可视化实验室

2015年12月8日,英国帝国理工学院(Imperial College London)郭毅可教授访问北京大学,并作了题为《Big Data for Better Science》的学术报告。郭毅可教授是帝国理工学院数据科学研究所(Data ScienceInstitute)的创始人,计算机系教授。

76584fddjw1eysjnyetzsj218g0xcgv7

继续阅读 »

密西西比州立大学张嵩副教授访问北京大学可视化实验室

2015年12月5日,密西西比州立大学(Mississippi State University)的张嵩副教授访问北京大学,并作了题为《Visualizing Ensemble Uncertainty in Numerical Weather Simulations》的学术报告。张嵩副教授博士毕业于布朗大学,本科毕业于南开大学。目前是密西西比州立大学计算机科学与工程系的副教授,目前主要研究方向是科学可视化,数据分析,医学图像处理,和计算机图形学。 继续阅读 »

SensePath: 通过分析出处理解意义建构过程(SensePath: Understanding the Sensemaking Process through Analytic Provenance)

使用SenthPath分析网页浏览数据

刚过双十一,又迎双十二,互联网上购物热潮此起彼伏,电商究竟是如何“抓住消费者的心“的呢?从海量浏览数据中发现消费者最终购买商品的因素,这个分析过程涉及算法、人机交互、社会学、心理学等范畴。就人机交互领域范畴中,术语”Sensemaking”表示构建信息与意义之间关系的概念性工具。通过分析网页浏览历史记录、总结出某种操作模式、理解其行为背后的含义,就属于一种Sensemaking过程。Sensemaking,“意义构建”,是指在不确定的情况下,通过发现信息以获取知识达到理解,从而做出决策的过程。想要理解淘宝网上的用户决定购买商品的行为,数据分析研究者首先要收集用户在淘宝网上浏览的过程、做了哪些逗留和比较等等,然后需要翻译和揣测这些动作行为背后的含义与逻辑,最后得出影响用户购买行为的决策因素。了解sensemaking的过程很有意义,因为这可以帮助广大数据分析研究者建立有效的模型和分析工具,从而再服务于应用于分析大型和复杂的数据集。然而就目前而言,sensemaking仍然需要大量的人为观察和记录,十分费时费力:研究人员采集观测数据、录制屏幕视频、录下思考过程语音、找出循环模式,并最终抽象出某种通用的行为模式,从而得出结论。为了帮助sensemaking过程,来自伦敦密德萨斯大学的研究团队推出了他们的研究成果SensePath,一种基于浏览器的在线sensemaking分析工具。他们在今年的国际可视化顶级会议IEEE VIS 2015上报告了这一成果[1],让我们一起来看一下这个SensePath的设计和界面吧。

继续阅读 »

任务驱动的主题模型比较 (Task-Driven Comparison of Topic Models)

task_driven_topic_comparison_tiser_lg

主题模型算法是文本处理与数据挖掘中一个非常重要的方法,它可以有效地从文本语义中提取主题信息。目前,主题模型已经被广泛地应用于文本分析领域。目前,有不少有效的工具来分析主题模型生成的结果,但却很少有工作去用可视化的手段来比较两个不同的主题模型。这篇论文就是从主题模型的比较入手,通过多种可视化方法来更有效地对不同主题模型的结果进行比较。

继续阅读 »