标签存档: 可视分析

西藏拉萨中学师生参观北大可视化与可视分析实验室

2018年1月4日,来自西藏拉萨中学的2名老师、10名学生以及正在拉萨中学支教的北京大学第十九届研究生支教团西藏分团的4名志愿者同学,来到北京大学可视化与可视分析实验室参观。志愿者中有一位是我们实验室的硕士生田敏同学。

继续阅读 »

EVA: 可视分析用于识别欺诈事件

金融机构需要为他们的客户确保安全和质量,如银行需要及时识别和阻止有害的交易。 为了检测欺诈操作,通常使用数据挖掘技术和客户画像分析,但是这些方法目前还没有得到可视分析的支持。 然而可视分析技术可以帮助增强知识发现的过程,并提高欺诈事件探测系统检测和预测的准确性。因此,这篇文章提出了EVA,一种用于欺诈交易的可视化分析方法,将自动算法与可视分析相结合,提高系统检测的准确性。

继续阅读 »

对TensorFlow中数据流图的可视分析(Visualizing Dataflow Graphs of Deep Learning Models in TensorFlow)

对TensorFlow中数据流图的可视分析

TensorFlow是谷歌开发的、当下最流行的机器学习软件库之一。它采用数据流图(Dataflow Graph)来表达机器学习算法的计算过程,用户可以定制不同的数据流图来构建自己的算法。然而,随着深度学习的兴起与流行,各类神经网络渐趋大规模、复杂化。算法开发者仅凭借自身的理解与记忆、很难把握算法的各部分体系结构,相互之间也难以进行沟通。为此,这篇文章[1]提出了可视化工具TensorFlow Graph Visualizer,通过可视分析帮助用户在TensorFlow中进行算法分析与开发。值得一提的是,该文章荣获了IEEE VAST 2017的最佳论文奖(Best Paper Award)。

继续阅读 »

CrystalBall: 对于社交媒体数据进行未来事件识别和分析的可视分析系统 (CrystalBall: A Visual Analytic System for Future Event Discovery and Analysis from Social Media Data)

社交媒体数据可以为世界各地发生的事件提供宝贵的见解,且事件本质上是时间和空间的。现有的文本可视分析系统专注于探测和分析过去和正在进行的事件,很少有人利用社交媒体信息来寻找未来可能发生的事件。在本文中,我们提出了一个交互式可视化分析系统CrystalBall,它可以自动识别和排列来自Twitter的未来事件。 CrystalBall集成了新的方法,通过交互式可视化发现事件,从而可以识别未来事件。该方法利用有关的时间,地点,社交网络和消息,整合了七种不同的方法来识别和表征未来事件。同时,可视化界面与计算方法紧密结合以提供未来可能事件的简明摘要。

继续阅读 »

Pattern Trails: 对子空间中数据变化的可视分析(Pattern Trails: Visual Analysis of Pattern Transitions in Subspaces)

在高维数据中,任意维度的组合都形成一个子空间,数据关系则因维度考量的不同而发生改变。举例来说,虎与狼在肉食性、体型、栖息地等方面相近,但在基因组成、群聚性上,虎与猫则更为相近。然而,维度的组合极其繁多,其数量随维度的增多而呈指数级增长。对于如此大量的子空间,我们该如何发掘其中数据关系的变化呢?针对该问题,这篇发表于IEEE VAST 2017的文章[1]提出了Pattern Trails,一种基于可视化的交互式分析方法。

继续阅读 »

无轨迹信息时空统计数据的数据流分析与可视化(Data Flow Analysis and Visualization for Spatiotemporal Statistical Data without Trajectory Information)

地理可视化研究使用多种技术来表示和探索时空数据。这些技术的目标是使用户能够在空间和时间上探索事件和交互,以便于发现数据中的模式、异常和关系。然而,对于没有轨迹信息的非方向性统计数据,很难提取和可视化数据流模式。在本文[1]中,我们开发了一种新的流分析技术,以提取、表示和分析无方向时空数据流图,而不受轨迹信息的影响。我们估计这些事件在空间和时间上的连续分布,并利用重力模型提取空间和时间变化的流场。然后,我们使用流可视化技术可视化数据中的时空模式。用户在地图上呈现地理参考离散事件的时间趋势。因此,整体的时空数据流模式帮助用户分析地理时空的事件,如疾病暴发,犯罪模式,等来验证我们的模型,我们丢弃的轨迹信息在OD数据集和应用我们的技术数据和比较得出的轨迹和源。最后,我们提出了包括推特数据统计数据的时空趋势分析、海上搜救事件和症状监测案例。

继续阅读 »

Hashedcubes: 对于大数据的简洁,低存耗,实时的可视探索 (Hashedcubes: Simple, Low Memory, Real-Time Visual Exploration of Big Data)

交互式可视化系统的设计者现在正面对着大规模、多维度的数据的挑战。这一工作为以下问题提供了一个肯定的答案:是否存在一个简单的数据结构为一个更成熟的索引提供更丰富的性能,同时使空间消耗相对较低、执行方法较为简便?

继续阅读 »

用于文本相似性检测的可构造可视分析(Constructive Visual Analytics for Text Similarity Detection)

检测文本之间的相似性是一种很常见的文本挖掘任务。由于文本相似性的衡量方式很多,而且很多衡量方式对于不同的语料集的敏感性不同,所以通常使用机器学习等检测器难以根据特定的语义环境来平衡不同的度量方式。因此,为了促进文本相似性检测的准确性,把相关领域的专家加入到检测过程中,自主的设计对应的衡量方法时检测结果更佳。

继续阅读 »

对于机器分析和人类分析在分类中的解析 (An Analysis of Machine- and Human-Analytics in Classification)

这项工作跟踪在两个可视化分析应用中的技术和认知过程,并归纳为一个应用软知识的共同理论模型,可以添加到建立一个决策树模型的可视化的分析过程中。 继续阅读 »

通过可视化分析地理因素对多变量聚类的影响(Visualizing the Impact of Geographical Variations on Multivariate Clustering)

通过可视化分析地理因素对多变量聚类的影响

多变量地理空间数据是一种十分常见的数据类型,例如对各大城市的人口状况统计、世界各国的国力评判指标等等。如何分析地理因素(如地域的位置、范围、方向等)对多变量数据的影响,一直是地理信息、可视分析等领域的重要课题。另一方面,聚类是简化多变量分析的常用方法,它能够挖掘相似数据、总结数据特征、并消除变量增长所带来的负担。然而,当下的聚类分析方法并没有考虑地理因素的影响。这篇发表于2016年EuroVis会议的文章[1],就探讨了如何通过可视化分析地理因素对多变量聚类的影响。

继续阅读 »