作者存档: qingya.shu

SensePath: 通过分析出处理解意义建构过程(SensePath: Understanding the Sensemaking Process through Analytic Provenance)

刚过双十一,又迎双十二,互联网上购物热潮此起彼伏,电商究竟是如何“抓住消费者的心“的呢?从海量浏览数据中发现消费者最终购买商品的因素,这个分析过程涉及算法、人机交互、社会学、心理学等范畴。就人机交互领域范畴中,术语”Sensemaking”表示构建信息与意义之间关系的概念性工具。通过分析网页浏览历史记录、总结出某种操作模式、理解其行为背后的含义,就属于一种Sensemaking过程。Sensemaking,“意义构建”,是指在不确定的情况下,通过发现信息以获取知识达到理解,从而做出决策的过程。想要理解淘宝网上的用户决定购买商品的行为,数据分析研究者首先要收集用户在淘宝网上浏览的过程、做了哪些逗留和比较等等,然后需要翻译和揣测这些动作行为背后的含义与逻辑,最后得出影响用户购买行为的决策因素。了解sensemaking的过程很有意义,因为这可以帮助广大数据分析研究者建立有效的模型和分析工具,从而再服务于应用于分析大型和复杂的数据集。然而就目前而言,sensemaking仍然需要大量的人为观察和记录,十分费时费力:研究人员采集观测数据、录制屏幕视频、录下思考过程语音、找出循环模式,并最终抽象出某种通用的行为模式,从而得出结论。为了帮助sensemaking过程,来自伦敦密德萨斯大学的研究团队推出了他们的研究成果SensePath,一种基于浏览器的在线sensemaking分析工具。他们在今年的国际可视化顶级会议IEEE VIS 2015上报告了这一成果[1],让我们一起来看一下这个SensePath的设计和界面吧。

继续阅读 »

Detangler: 多重网络的可视分析(Detangler: Visual Analytics for Multiplex Networks)

网络结构的节点间有关联,如何评估和理解网络内部关联和分组的行为,是分析网络的核心任务之一。若网络中存在不止一种类型的关联,则称之为多重网络。比如,一个包含若干新闻数据的文档集合,文档之间的关联可以是新闻内容相关、新闻提及的地点相关、或者是人物相关、作者相关等等。这些不同相关类型使文档之间存在不同类型的关联,文档和文档之间可能存在不只一种关联性。所以,多重网络的节点之间关联性会有重叠,这使对多重网络内部分组行为的分析变得更困难。在今年欧洲可视化会议EuroVis2015上,一篇文章提出了Detangler系统,支持对多重网络中凝聚的节点组的可视分析。
继续阅读 »

Stroscope: 不规则测量时序数据的多尺度可视化方法(Stroscope: Multi-Scale Visualization of Irregularly Measured Time-Series Data)

生活中很多被记录的数据都有时间信息:信用卡刷卡记录了消费行为、健康测量数据记录某个病人在发病时各项指标系数。传统时序数据可视化可以展示数据值随着时间如何变化,比如观察折线图中曲线的起伏,信用卡消费支出的变化一览无疑。然而,不知你有没有思索过,这些可视化方法是否“准确如实”地传达出测量数据的所有信息?
这里,一篇有趣的论文就指出了这么一个问题,一个极其重要却往往被传统时序数据可视化忽视的现象:大多数的时序数据都是伴随着事件发生,其测量的的频率间隔并不规则,对这类非规律频率测量的时序数据(以下简称非规则测量时序数据)而言,测量频率/测量间隔本身也是一个重要的信息。比如该如何表示缺省的测量值?对于没有测量点的时间段,传统的采用插值的方法来猜测的数值是否会造成误会?
继续阅读 »

(s|qu)eries: 面向事件序列的视觉正则表达式检索浏览工具(Visual Regular Expressions for Querying and Exploring Event Sequences)

电子产品融入日常生活为我们带来大量便利的同时,也记录下我们周围形形色色的活动和状况:医疗中的电子病例记录、网站上的用户点击和浏览历史记录、“量化生活”(Quantified Self,一个记录个人健康数据的电子产品)、眼动追踪记录或者各式各样的输入设备和软件运行日志等等。分析这些事件序列数据可以帮助数据科学家可以找到我们使用这些产品的潜在规律,比如通过查看移动应用的使用日志,检测到异常发生的情形,并总结用户交互的流程,从而辅助决策者来做出改善,以改善产品以提高市场竞争力。

继续阅读 »

相似性探索:针对多角度气候模型的比较可视化工具 (SimilarityExplorer: A Visual Inter-Comparison Tool for Multifaceted Climate Data)

在气候数据分析中,相似性比较对研究不同气候模型之间存在共识和差异很重要。陆地生物圈模型等气候模型模拟了生态系统在时间和空间上的变化,比如光和作用,呼吸作用等。众所周知,交互可视化方法可以让研究者们更方便地浏览数据,从不同角度和粒度下对数据进行分析。但目前并不存在一个特别针对气候模型数据比较的可视化工具。在今天的EuroVis2014会议上,美国纽约大学的学者针对气候数据提出他们的工作SimilarityExplorer[1]。作者首先提出了针对气候数据不同角度下模型相似度的四种可视化分析需求,之后从这些需求出发,作者设计了满足这些需求的四种可视化任务设计指导。最后基于这些设计指导,作者开发了一个可视分析工具SimilarityExplorer,它结合了矩阵、散点图投影技术、平行坐标等多种可视化技术,重点从空间和时间这两个角度出发,对气候模型之间相似度做比较。由于这些设计指导和开发的系统都是基于与气候领域专家讨论的基础上得出的,所以这个系统的实用性和有效性都得到很好的验证。

继续阅读 »

信息可视化与空间关系:设计机遇与实验性结论(Information Visualization and Proxemics: Design Opportunities and Empirical Findings)

信息可视化中,鼠标是常用的交互设备。然而,鼠标作为一个和桌面设备紧密联系的输入方式,对于一些非桌面设备并不能很好的适用。比如,对于高分辨率屏幕墙,用户站在这样的可视化终端面前,更直接的交互方式是通过他的移动、方位、朝向和距离来作为交互的输入。来自哥本哈根大学的学者针对高分辨率屏幕墙的信息可视化方法, 利用空间关系的概念作为出发点,探讨了大屏幕上信息可视化的交互方案。文章被发表在2013年可视化会议IEEE InfoVis上[1]。在论文中,他们也通过实验和用户研究,探讨了单用户和可视化终端之间的空间关系作为交互的可能行与可行性。同时,他们也已经开发了一个基于空间关系的初步原型系统,实现了诸如缩放、平移、查询和筛选等功能。实验在在不同用户和可视化任务下进行测试,被用来和以往的三维鼠标比较,得到了不错的结果。

继续阅读 »

TimeBench:应用于时序数据可视分析的数据模型与软件库 (TimeBench: A Data Model and Software Library for Visual Analytics of Time-Oriented Data)

我们生活的信息时代被数字包围,记录我们一举一动的许多数据带有时间的信息,被称为与时间有关的数据,或时序数据(Time-oriented Data),常见的时序数据如电子医疗记录、网络流量记录等等。时间是一个十分特殊的维度,不同于普通的数值变量维度,时间中存在不同粒度的计时方法和循环方式,选择何种的粒度取决于数据分析的具体应用。

继续阅读 »

MotionExplorer:基于层次化聚类的人体运动捕捉数据探索系统 (Exploratory Search in Human Motion Capture Data Based on Hierarchical Aggregation)

运动捕捉数据在体育、医疗和影视行业十分有用,已有的运动序列被用来做运动合成。然而这类数据因为其本身数据量非常庞大,同时具备高维与时序性质,对它们的浏览、分析和关键动作序列提取是一个难点。以往的分析工具中,专家会用手动提取的方法对数据库检索,然而这些建立在文本检索之上的工作实在繁琐,为此,来自德国的一批可视化研究者们开发出了系统MotionExplorer系统用于对运动捕捉数据的可视化方法的浏览与分析,这个直观的可视分析系统为运动捕捉数据的分析提高了效率和方便。

继续阅读 »

ManyVis:多应用集成的可视化环境系统(ManyVis: Multiple Applications in an Integrated Visualization Environment)

想象这样一个场景:你正做一个最新体可视化工作的演讲,播放到演示页面时,slides上直接出现体渲染的结果。你操纵鼠标对结果平移、缩放、编辑传递函数……实时交互的渲染结果与幻灯片衔接得非常完美,演讲很成功。另一个场景中,生物学家在显微镜旁对正观测的数据进行实时标注。虽然切片观测数据有GB量级之大,科学家依然能够用再普通不过的Photoshop观察某一部分数据,在适当处标注,之后保存导出合成的标注结果。 继续阅读 »

利用强度梯度直方图多级分割的层次化的体数据探索方式(Hierarchical Exploration of Volumes Using Multilevel Segmentation of the Intensity-Gradient Histograms)

科学可视化中体可视化是一个重要的研究方向,传递函数设计作为探索体数据的重要手段,则是体可视化的重点研究话题。传递函数通过将体数据中采样值映射成为颜色和透明度等视觉属性来描绘出图像。比如在医学CT扫描数据中,将肌肉对应的采样值所在的分布范围映射成黄色,骨头所分布的取值范围映射成白色,血液对应红色等等,辅以一定的透明度,我们便可以看到扫描数据的结果。传递函数设计中的映射可以从原始数据如强度出发,也可从数据的衍生属性如梯度出发,通常用户被提供一个描绘变量分布的直方图作为提示界面,在其上划取一段范围并指定它的映射特性,以此完成整个设计流程。

尽管在某些特定的领域如前文提到的医学应用,传递函数的设置存在一些经验性的参数约定,但对于普遍的传递函数设计本身来讲,这并不是一个容易的过程:用户需要在每次尝试过后查看效果,再做相应调整,而且有时,一个极其细微的调整也会对结果带来巨大的变化。所以,传递函数的设计是一个非常耗时且复杂的操作。为了让用户能够更好地探索和分析体数据,来自美国马里兰大学的学者们提出了一种层级化的体数据浏览方式。他们的解决方案针对强度-灰度二维传递函数,实现了一种多层级的半自动体数据划分,从而作为传递函数设计的新颖实现方式和交互手段。

exploration

继续阅读 »