分类存档: 论文报告

大规模实时社交媒体数据分析(Real-Time Visual Analysis of High-Volume Social Media Posts)

社交媒体平台上每时每刻都在发布各个领域的相关新闻、报告等信息,这些信息对于领域专家来说,往往具有极高的研究价值。而然,社交媒体数据的巨大规模以及极高的更新率对于分析工具提出了巨大的挑战。已有的相关工具有相当大的局限性——大量的分析系统仅仅支持事后的分析,因此缺失了社交媒体数据的事实性;支持实时分析的数据往往又难以支持大规模数据的涌入。还有一些工具依赖于额外的元数据,例如地理空间数据。近年来,包含这类元数据的社交媒体数据的比例不断下降,导致类似的工具的实用性越来越低。

继续阅读 »

图集合矩阵可视化的同步排序 (Simultaneous Matrix Orderings for Graph Collections)

矩阵可视化可以突出图数据中的局部结构。为了使这些结构表现为明显的视觉模式,人们提出了各种矩阵重排的方法来对矩阵的行和列进行适当排序。 但是,图数据可能不是孤立出现的,而是属于共享一组顶点的图集合的一部分。在这种情况下,已有的一种方法是选择一个图进行矩阵重排,然后推广到所有的图上;另一种方法是对所有图进行加权的合并,然后对合并后的图进行重排。然而这些方法都会损失信息,来自荷兰埃因霍芬理工大学的Beusekom等人 [1] 提出了一种考虑整个图集合的重排算法,如图1所示,可以同时对图集合中的所有图数据得到较好的矩阵重排结果。

继续阅读 »

探索交互日志来减轻人的偏见(Left, Right, and Gender: Exploring Interaction Traces to Mitigate Human Biases)

偏见影响着人们分析数据的方式和决策的结果。在可视分析系统中,人的偏见会体现在只对部分数据进行分析而进行决策,使得决策产生偏差。该工作研究如何通过可视化用户的交互历史(用户与哪些数据点和属性进行了交互),来降低人在可视化系统探索过程以及决策时的潜在偏见。

继续阅读 »

大规模粒子数据的计算属性上的交互选择 (Interactive Selection on Calculated Attributes of Large-Scale Particle Data)

在大规模的粒子数据中,有些属性需要在模拟过程中才能获得,比如温度、表面张力等。我们需要这些属性用来选择感兴趣区域的粒子,比如热点区域或者局部极值区域等,并在之后的模拟中观察粒子的变化情况。为了使用这些属性,我们可以首先运行一遍模拟过程,并把计算得到的属性保存下来,接着在系统中加载这些提前计算好的属性。然而,保存这些属性需要大量的磁盘空间,而且如果需要其他的属性,还需要再进行模拟以保存属性。另一种使用计算属性进行选择的方法是在模拟过程中实时计算并根据属性选择粒子,然而如果计算所有粒子的属性,模拟时需要分配更多的内存空间并使用更长的时间。本文结合3D视图刷选,提出了一种数据驱动的基于延迟计算的选择扩展方法[1]。

继续阅读 »

STRATISFIMAL LAYOUT:一种分层节点链接网络可视化的模块化优化模型(STRATISFIMAL LAYOUT: A Modular Optimization Model for Laying out Layered Node-link Network Visualizations)

节点链接图是一个用于显示网络中关系的有效工具。 来自美国东北大学的DiBartolomeo等人提出了STRATISFIMAL LAYOUT [2],关注于计算网络的分层布局,在这种布局中,节点被排列在一组平行的轴上,来更好地展示层次或顺序关系。通常基于启发式的布局方法 [1] 可以得到可读的,但不是最优的可视化结果,该工作提出了一种模块化优化模型来计算最优的节点布局。

继续阅读 »

基于深度学习推荐的分析面板设计 (MultiVision: Designing Analytical Dashboards with Deep Learning Based Recommendation)

从数据表格出发的自动可视化设计长久以来受到许多关注。1986年乔克麦金莱 (Jork Machinlay) 就提出基于用户对不同通道的感知有效性的APT [1] 工具。然而传统的方法依赖于经验规则,可能并不能得到最优结果。近年来,可视化研究社区也使用机器学习方法以支持可视化的自动创建[2]。但这些方法关注于给定数据属性之后的映射方法的选择,用户仍然需要花费时间与精力选择合适的数据项。为帮助用户选择数据,来自香港科技大学和微软亚洲研究院的伍翱宇等人提出MultiVision[3],旨在使用深度学习方法自动构建多视图的可视化。

继续阅读 »

响应式可视化的任务导向洞察的自动推理方法 (An Automated Approach to Reasoning About Task-Oriented Insights in Responsive Visualization)

由于移动设备的普及,可视化创作者需要考虑可视化在不同设备上的显示,即响应式可视化。通常,创作者实现针对桌面环境的可视化之后,通过改变大小、进行数据聚合等方法调整可视化以适应移动设备。然而,这一过程会改变原始的可视化传达的信息,需要创作者不断尝试不同设计,并考虑它们保留的信息,这一过程困难且繁琐。

继续阅读 »

非整洁数据:表格未知原因的有效性 (Untidy Data: The Unreasonable Effectiveness of Tables)

数据表格是一种人们熟悉的、原始的数据表现方式。在商业产品与数据统计分析工具繁多的当下,数据表格仍然在意义构建中扮演着重要的角色,并且绝大多数的数据工作者会选择使用数据表格作为他们的主要工具。本文通过一个全面的、定性的用户调研与实验探索了数据表格的优势以及在意义构建中是如何发挥作用的。

继续阅读 »

基于多边形的超图可视化的布局自动生成方法(Automatic Polygon Layout for Primal-Dual Visualization of Hypergraphs)

在超图中,每条边不再仅限于表示一个二元关系,而是能够表示一个任意的n元关系(n大于等于2),如果依然使用传统的点边形式(node-link)对超图进行可视化,那么每一条边都将被表示为一个团的结构,这会带来大量的边,导致视觉聚集,从而干扰用户对图结构的认知过程。本文提出了使用多边形来对超边进行可视化的方法(图1),并最终给出了一种支持对偶视图形式的自动布局算法。

继续阅读 »

VIS30K: IEEE国际可视化大会论文的图表集合(VIS30K: A Collection of Figures and Tables from IEEE Visualization Conference Publications )

可视化是一个依赖于图像和视频来展示和解释研究工作的学科。在可视化论文中,图像是必要的部分,能够帮助我们理解复杂的科学概念。而浏览一个领域的图像可以很好地揭示时间趋势和常见的实践,且可以对子学科进行比较。该工作是俄亥俄州立大学交互视觉计算实验室和斯图尔特大学可视化研究所等的合作研究,从可视化领域的顶级会议IEEE国际可视化大会 (IEEE VIS)收集了近三十年的接近三万张图表,并开发了一个图片浏览工具。

继续阅读 »