月度存档: 九月 2017

无轨迹信息时空统计数据的数据流分析与可视化(Data Flow Analysis and Visualization for Spatiotemporal Statistical Data without Trajectory Information)

地理可视化研究使用多种技术来表示和探索时空数据。这些技术的目标是使用户能够在空间和时间上探索事件和交互,以便于发现数据中的模式、异常和关系。然而,对于没有轨迹信息的非方向性统计数据,很难提取和可视化数据流模式。在本文[1]中,我们开发了一种新的流分析技术,以提取、表示和分析无方向时空数据流图,而不受轨迹信息的影响。我们估计这些事件在空间和时间上的连续分布,并利用重力模型提取空间和时间变化的流场。然后,我们使用流可视化技术可视化数据中的时空模式。用户在地图上呈现地理参考离散事件的时间趋势。因此,整体的时空数据流模式帮助用户分析地理时空的事件,如疾病暴发,犯罪模式,等来验证我们的模型,我们丢弃的轨迹信息在OD数据集和应用我们的技术数据和比较得出的轨迹和源。最后,我们提出了包括推特数据统计数据的时空趋势分析、海上搜救事件和症状监测案例。

继续阅读 »

美国雪城大学艺术学院访问北京大学

 

2017年9月23日下午,美国雪城大学艺术学院的Michael Tick教授、Reige Xu副教授、Sam Van Aken副教授到访可视化与可视分析实验室,并就艺术可视化相关知识进行分享。

继续阅读 »

悉尼科技大学Jie Lu教授访问北京大学

2017年9月19日下午,悉尼科技大学的Jie Lu教授访问北大可视化与可视分析实验室。Jie Lu教授是一位国际知名的,在模糊迁移学习、决策支持系统、推荐系统、预测和提早警示系统方面的有卓越贡献的科学家。她担任悉尼科技大学Engineering and Information Technology院Research Excellence的副主任,她还是Centre for Artificial Intelligence (CAI)的负责人。她出版过6部研究性的书籍,在学术期刊和会议中发表过400余篇论文。在过去的15年中,她获得过8次Australian Research Council (ARC)的探索津贴和10次其他研究津贴。

继续阅读 »

VIGOR: 交互式探索图查询结果(Interactive Visual Exploration of Graph Query Results)

当领域专家需要寻找大图中满足特定条件的子图时,图查询操作是一种重要的方法。比如在金融交易网络,分析者想要发现洗钱行为,可以查询商人和银行家构成的环状网络。尽管有许多工作研究如何构建查询语句、数据库管理、图匹配算法,但是少有工作帮助分析者理解子图的结构以及属性特征。这项工作[1]设计了一个原创可视分析系统,帮助用户探索、理解子图查询的结果。

继续阅读 »

ConceptVector: 基于词嵌入的交互式词典构建进行文本可视分析 (ConceptVector: Text Visual Analytics via Interactive Lexicon Building using Word Embedding)

目前而言,许多文本分析方法的核心都是一个Concept:一组表征特定对象、现象或主题的语义相关的关键词。另外,Word Embedding的不断发展允许用户通过一小部分的关键词来构建一个Concept。然而,由于自然语言的多义性,直接使用这种技术可能导致错误。为了降低这个问题,这篇文章[1]提出了一个名为ConceptVector的可视分析系统,来指导用户构建这些Concepts,然后使用它们来分析文档。这篇文章使用现实生活中的数据集来进行案例分析,展示了ConceptVector的细粒度分析。为了支持这个“种子关键词”的概念,他们引用了双极概念模型,并且支持不相关的单词。

文本可视分析中涵盖了很多领域的方法:1. 词关系与层次结构;2. Word Embedding;3.基于单词层次的文本可视分析。

继续阅读 »

针对航空交通分析的轨迹相关部分聚类方法(Clustering Trajectories by Relevant Parts for Air Traffic Analysis)

如今移动物体的轨迹数据在多个领域被广泛的收集,如动物生态学,运动以及航空。移动物体的相似轨迹的聚类是运动分析中的重要技术。可以使用距离函数基于轨迹点或段的属性来评估轨迹之间的相似性。属性可能包括空间位置,时间和其他数据属性。有这样的需求,需要分析轨迹的某些部分,即具有特定属性的点和段。根据分析焦点,需要对轨迹的相关部分进行聚类。在整个分析过程中,焦点可能会改变,轨迹的不同部分可能会变得相关。这篇文章[1]提出一个分析工作流程,其中使用交互式过滤工具将相关标志附加到轨迹点,聚类是使用忽略不相关元素的距离函数完成的,并且汇总了所得到的聚类进一步分析。

该工作有三个主要的工作流程,分别为过滤,聚类和汇总分析。 继续阅读 »

针对大规模应用的欧拉-拉格朗日组合数据表示方法 (A Combined Eulerian-Lagrangian Data Representation for Large-scale Applications)

在科学应用中,模拟的数据输出形式主要有两种。一种是欧拉表示,也就是通常说的体数据,在固定的格点上记录数据信息,不过对于格点之间的区域往往需要插值。另一种是拉格朗日表示,即粒子数据,记录了离散粒子在数据场内的运动,其缺点是在一些感兴趣的区域可能没有粒子出现。在传统方法里,这两种数据表示形式在不同的分析任务中往往是独立存储和访问的。 为了提高计算效率,我们需要一种将两者进行结合的高效的组合表示形式。这篇文章[1]针对这一问题提出了一种欧拉-拉格朗日联合表示方法,可以对两种形式的原始模拟输出数据同时进行重组织,提高了数据载入和一些基本数据操作的效率。

继续阅读 »

ACTIVIS: 工业规模深度神经网络的可视化探索 (ACTIVIS: Visual Exploration of Industry-Scale Deep Neural Network Models)

深度学习在许多领域,比如计算机视觉、自然语言处理,取得相当重要的突破。尽管越来越多公司在他们的产品上,用越来越多深度学习模型。但这些模型依靠非常多的参数,尝试从数据中学习隐藏的非线性的结构。这个特点,使得人们难以理解模型的结果,难以分析模型不好的原因进而采取进一步的措施。

近些年,越来越多研究者研发可视化工具,尝试帮助人们理解深度学习模型的结果。但现有的工具,往往针对某一特定的模型和某种类型的数据,不能满足工业界的需求。在工业界,一方面,使用的模型种类非常多,模型结构非常复杂;另一方面,分析的数据类型非常丰富,数据量也非常的大。

为此,本文提出ACTIVIS[1],一个支持工业界深度学习模型分析的可视化探索工具。

继续阅读 »

延迟不确定性和其对火车旅行规划的影响的可视化(Visualization of Delay Uncertainty and its Impact on Train Trip Planning: A Design Study)

火车延误的不确定性对火车旅行具有很大的影响。延误可能导致转车时错过连接火车,或到达目的地比预约的时间要晚。面对这种不确定性,旅行者希望预先知道火车可能的延迟。目前,火车旅行规划是基于两站之间的预定的时间。虽然有几种可视化方法可以显示时间不确定性,但没有专门的视觉设计支持行程规划。对于这些问题,我们提出了一个评估视觉设计,延迟火车旅行规划与延迟不确定性可视分析系统。它列出了预定的火车线路连接,预期的火车延误以及它们对到达时间的影响以及错过转车的可能性[1]。

继续阅读 »

Hashedcubes: 对于大数据的简洁,低存耗,实时的可视探索 (Hashedcubes: Simple, Low Memory, Real-Time Visual Exploration of Big Data)

交互式可视化系统的设计者现在正面对着大规模、多维度的数据的挑战。这一工作为以下问题提供了一个肯定的答案:是否存在一个简单的数据结构为一个更成熟的索引提供更丰富的性能,同时使空间消耗相对较低、执行方法较为简便?

继续阅读 »