今天是 Pacific Visualization 正式会议的第二天,王飞跃教授做了主题演讲,此后有 3 个 full paper session 、 poster session 以及 banquet。
Keynote 是王飞跃教授做的演讲,题目为 Visualization and Knowledge Automation: Enterprise 5.0 and Parallel Evolution,这篇论文主要内容是论述可视化对于平行虚拟现实改革的推动作用,所谓平行就是指 ACP 的平行理念,也就是人工社会(Artificial Societies)+ 计算实验(Computational Experiments)+ 平行执行(Parallel Execution)。从本质上来讲,ACP 的平行理念的 核心就是把复杂性与智能化系统“虚”的和“软”的部分建立起来,通过可以定量实施的计算化、实时化,使之“硬化”,真正用于解决实际的问题。而所谓的大数据和云计算以及物联网正是支撑 ACP 方法的核心技术。可视化方法也将成为支撑 ACP 并大力推动平行虚拟现实改革的重要方法和工具。
来自香港科技大学的 Qing Chen 展示了网络课程点击流数据可视化。他们根据用户使用网络课程的行为,比如播放、后退、快进、暂停等,分析用户在网络课程中的行为特征,比较课程在时间、地区上的热度变化情况,根据用户对特定课程的使用行为特征,分析该课程各个部分的结构是否符合用户学习习惯、内容布置是否合理。如图1,图中蓝色部分表示用户在使用网络课程时的拖拽行为。显然,美国用户在观看网络课程时,更喜欢拖拽,根据自己的实际需要选择观看的内容;但中国用户更倾向于从头到尾完整的看完整个课程。这个在线工具(http://vis.cse.ust.hk/vismooc),采用简单直观的方式展示网络课程点击流的情况,既方便普通用户查看相关课程在时间、空间上的热度变化趋势,也方便相关的研究者分析课程内容设计的合理性,分析不同地区用户的学习习惯等。个人觉得,对于普通用户来说,他们也许更希望这个工具可以推荐相似课程。同时,甚至可以尝试分析用户对课程的评价,帮助用户快速判断特定课程的使用价值等。
来自德国 University of Kaiserslautern 的团队展示了他们针对移动采样装置收集的气象相关的数据的城市微气候可视分析系统。这种移动采样装置会在城市里移动,形成一条轨迹。和传统的轨迹数据相比,每个采样点除了有时间、地理坐标的信息外,还增加了空气温度、地表温度、相对湿度等气象相关信息。这个工作主要借鉴了 Tominski 和 Andrienko 在3维轨迹数据可视化方面的工作,在3维的条带上堆叠展示每个属性的折线图。整个探索交互流程如下,首先会切分轨迹,根据采集的气象属性,使用 K-means 和 SOM 聚类算法切分轨迹,并在2维的地图上展示出切分的轨迹。之后用户可以选择关心的区域,切换到3维的模式观察分析每个属性在空间上的分布。如下图所示,每个属性在空间上的分布用折线图堆叠起来,最上方的一层是聚类后每段条带的分类结果。这个工作的关键是数据比较新颖,在设计上面借鉴Tominski的工作较多,创新不足。同时在轨迹切分时可以使用路网信息切分而不是直接使用聚类算法,这样能够更好的帮助领域专家理解。
来自 Linz University 的 Holger Stitz 介绍了他们在服务器集群监测方面的可视化工作。刚看到他们 paper 里面的 teaser image 的时候,风格似曾相识。前年 IEEE VIS VAST 的 best paper 工作 LineUp 以及去年的 Tablet data 都是出自他们之手,难怪 UI 风格相似。因为集群的监测是个刚需,其实也有工业界的产品被商业公司所使用,但是这些产品的可视化(或者说前端)功能有些不足。他们在标题上就表明了是分治的方法,划分是按照功能(semantic),并对网络的拓扑结构、节点的关键参数和状态(CPU、内存等)进行展示,还支持在前端动态的(有限制的)修改拓扑结构。从这个工作的结果上看,比市面上的工具在展示的内容和交互方面有所改进,但是存在不少的问题,比如配置,自适应,通讯冗余等。而且他们声称的亮点之一——动态改变网络结构(比如把某个 VM 放到另外的机器上运行),可能在实际上并没有这个需求。工业上维护集群的人基本习惯于命令行操作,而且需要根据不同的情况做出不同的调整策略。前端的交互操作需要后台的命令支持,而运维人员可能会觉得这个前端交互略显鸡肋。
对于德国斯图加特大学的论文基于它们之前的ScatterBlogs的一个进一步的改进与评估。ScatterBlog 是一个基于社交网络的可视分析系统,可以分析社交网络中带有地理坐标的数据,包括 geo-tagge twitter、foursquare 等数据源,展示了空间分布、时间分布以及关键词分布。系统提供了一系列基于机器学习算法、关键词抽取、主体模型等方法,来辅助判断实时舆情的变化。在这个展示的案例中,它们主要关注于突发社会事件或者自然灾害等事件,因为社交网络在这些事件中往往是最快速的新闻来源,并且与地理相关。因此对于streaming data,用户可以实时观察到哪些地方有哪些灾害,并且影响有多大。这次他们展示了关于洪水灾害的例子,当洪水来临的时候,许多人在不同的地方发了带有洪水的 tweets,将这些 tweets 集合起来看,那么我们可以发现不同地点的受灾程度,以及灾后重建工作的需求以及进展等。这个工作很好地利用了 Twitter 的实时性,并且系统十分健壮。在与作者的聊天之后,了解到他们将要在这个工作进行进一步的扩展,并且利用这个项目进行创业。利用大规模社交网络进行辅助舆情监控的系统与公司并不多见,如果在这个领域着力,那么可视化一定能发挥出很大的价值。当然许多专家的反馈也十分有用,主要的意见是觉得这个很有意义,但也有改进的空间,比如更深层次地挖掘语义,而不仅仅是关键词,分类与训练的正确率也需要更好地结合人的探索与交互更好提问。另一个可以研究的问题是,如何使用 Twitter 数据与其他数据相结合,结合不同源的数据进行进一步的可视分析也是一个挑战。
今年的 Best Paper 获奖者之一是来自 Ohio State University 可视化小组提出的针对材料碳纤维扫描数据可视化方法 MetaTracts。近年来,碳纤维相比传统材料的物理优越性使其成为工业领域炙手可热的建筑材料,然而仍没有现有的可视化工具帮助科学家理解碳纤维材料的内部结构。MetaTracts 可以提取并展示科学家感兴趣的纤维束结构(Fiber Bundles)和编织特征(Weaving Patterns)。这个方法首先对扫描的材料纤维体数据做近似的追踪,之后再对基本的几何单元做层次聚类,聚类的标准是基于纤维局部的方向、距离,从而提取感兴趣的纤维束。最后,科学家可以选择用体(Volume)或者面(Mesh)的可视化方法来查看提出的纤维结构。现场提问的学者期望该工作拓展到DTI数据,也有学者向报告人确认了工作的User Evaluation,报告者。观察这届Pacific Vis会议的提问环节,存在一个现象:年轻学者会对算法的正确性、实现细节、以及工作的拓展更感兴趣一些;而相比而言,年长的学者更关注可视化工作的受用用户和实用性,从而,提出的问题更深刻犀利一些。
下午第一篇 paper 来自微软研究员的 Bongshin Lee:SketchInsight: Natural Data Exploration on Interactive Whiteboards Leveraging Pen and Touch Interaction。她更具体地介绍了第一天带来的 SketchInsight 工具,Lee不仅讲了工具的设计还总结了一些通用的 NUI 设计方法。不论是扁平化还是拟物化的UI设计都固化了视觉印象,NUI 则提供了更宽松的思维流程。就像Lee所说,触控让人们不必操作菜单和按钮,可以获得更好的反馈体验,设计良好的手势让操作更加自然流畅并充满趣味性(Pen and touch gestures enable people to trigger specific system responses without using menus or buttons. Well-designed gestures can be natural, fluid, and even fun. It is tempting to design and support many gestures to cover many features.)。类似的手势功能我们也能在其他工具中见到,比如输入法的手写输入还有 iOS 的 Calculator 类应用,它们通过识别手写符号的特征来将草图处理成文字或公式,Calculator 还支持画多条线以删除的手势,这些都是NUI手势很好的应用。相信 SketchInsight 以后会愈来愈完善,更加智能和友好。
接下来是来自清华大学刘世霞老师的工作,他们要解决的问题是避免遮挡和混淆的标签布局(label layout)。他们先研究了用户如何观察和理解标签的,得出了一个 cognition model。针对这个模型设计了一个尽量去除遮挡和混淆的标签布局算法,从他们的 presentation 来看,计算公式也比较符合直观,结果从速度上和视觉上都不错,是一个不错的工作。期待他们实现上的进一步改进,并做成开源的库让可视化开发者受益,但是如何把这个算法集成到现有的流行工具库如 D3js 中还有待探讨。
在 Han-Wei Shen 小组的论文 Uncertainty Modeling and Error Reduction for Pathline Computation in Time-varying Flow Fields 中,他们提出了对于时间维度下采样后迹线计算的误差模型,并以此误差模型对迹线进行修正。文章基于一个前提,即内存只能同时存储若干时间步的向量场,而非整个向量场。其误差的模型其实就是对在下采样的过程中略去的时间步的值用 Bezier 曲线进行拟合。由于有限内存的限制,无法同时得到所有时间步的值,所以作者又提出了一个增量拟合的算法。但是,这里似乎存在一个算法上的问题:在文章式子(6)中,计算插值实际上是只需要知道y_0和y_n的,这意味着直接先读取这两个时间步的向量场就可以了,而不一定非得“存储所有从y_0到y_n的值”,所以文中的增量拟合的方法也就不存在动机了。在对误差建模之后,作者考虑根据拟合后符合高斯分布的误差对迹线计算结果进行修正。这里对误差为什么符合高斯分布还并不是很明白,但是可以看到高斯分布对计算带来了极大的便利。在文中所展示的结果中,也能看到作者提出的前向迹线与后向迹线交集的方法产生了比较好的结果。最后总起来看,这个工作实际上有些压缩的思想在里面。作者同样使用了Bezier曲线拟合进行压缩,不过是对原始的向量场。但是他们并不是直接应用解压压缩的结果,而是使用了压缩产生的误差来修正压缩后的可视化结果。
另一个令人激动的环节是 Poster Fast-forward,总共有将近20篇 poster,每个poster的作者需要做1分钟的简要介绍,而后有专门的 poster session,所有参会者会在 poster 会场与作者交流,本次北京大学共有5篇 poster,领域包含科学可视化中的流场可视化、集合可视化,以及可视分析中的社交媒体可视分析以及网络安全可视分析,各国的专家与学生都过来进行了提问与交流,在这次交流中,许多专家提出了许多有建设性的意见,包括从可视化设计的目的而言,以及为什么要做这样的设计与分析,到最后如何验证你的结论等等,专业且切中要害,给了同学们很多的启发与建议。
晚上的宋城千古情,与其说是一个艺术表演,还不如说是一个结合多种最新科技技术的可视化盛宴。整个盛宴将杭州重要历史事件展现出来,从宋高宗盛世到岳飞精忠报国,从白娘子许仙到梁祝,从黄梅戏杭州古典舞蹈,确实非常震撼。
评论关闭。