第七届中国可视化与可视分析大会(ChinaVis 2020)Day 1

11月1日上午,第七届中国可视化与可视分析大会(ChinaVis 2020)在西安陕西宾馆隆重举行。本次大会以“数据求真,可视为善”为主题,由中国图象图形学学会主办,可视化与可视分析专委会、西安电子科技大学、西北大学、西安理工大学、陕西师范大学、西安财经大学、西安市碑林环大学创新产业带管理委员会、西安市大数据与视觉智能关键技术重点实验室承办,多家赞助单位协办。大会吸引了来自全国各地高校、研究院所和企业近600位参会代表,领域顶尖专家学者与参会代表共同探讨数据可视化与可视分析的前沿技术和未来前景。

大会主席西安电子科技大学苗启广教授首先介绍了到场的领导和嘉宾、以及ChinaVis 2020的筹备情况。苗启广介绍到,由于今年新冠疫情的影响,ChinaVis 2020于7月19日-21日预先举办了一场线上的大会,为进一步促进交流,加强合作,特于10月31日-11月3日再次组织线下会议,希望大家珍惜这次来之不易的机会,多多交流。最后,苗启广教授对各位参会人员表示热烈欢迎,并宣布大会正式开幕。随后,西安电子科技大学校长助理张进成、陕西省工业与信息化厅大数据总工程师贾晓刚、中国图象图形学学会可视化与可视分析专委会主任袁晓如分别致辞。

大会特邀报告

本次大会邀请了国际知名可视化学者Tamara Munzner作大会报告。Tamara Munzner教授任教于加拿大英属哥伦比亚大学(University of British Columbia)计算机系。她师从Pat Haranhan教授(2019年图灵奖获得者),2000 年获美国斯坦福大学博士学位。Tamara Munzner教授的主要研究方向是从用户驱动和技术驱动的角度出发,评估和描述可视化系统和技术。2015年,她因在为可视化设计提供系统的科学依据方面的突出贡献,获可视化领域的技术成就奖。

Tamara报告的题目为《Problem-Driven Visualization Through Design Studies》(通过设计研究开展问题驱动的可视化工作)。这里的设计研究包含设计可视化系统、验证可视化设计、反思结果来改进可视化的设计指南。Tamara的报告对设计研究的方法论和具体流程进行了讨论,帮助可视化研究者避免潜在的陷阱。

报告会现场

Tamara将可视化系统的设计分为4个嵌入式层级:

  1. 可视化研究者在开展以问题为驱动的研究时,必须明确领域专家的需求,需要解决的核心问题是什么。
  2. 在了解领域专家的问题之后,需要对任务进行抽象概括,从而提取该问题与其它问题的共性,采用解决该问题的合适方法。
  3. 可视化研究者需要提出并且论证解决问题的具体可视化设计,系统交互方法。
  4. 基于以上的设计,进行系统实现。

前三个步骤是以问题为驱动的研究,最后一个步骤是以技术为驱动的研究。本次报告关注以问题为驱动的研究。

可视化设计和验证的嵌入式模型

Tamara结合自己开展问题驱动研究的经历,将其中的设计研究划分为3大步骤,前提(precondition),核心(core),分析(analysis)。前提指可视化研究者首先需要掌握足够的可视化知识(learn),包括可视化的编码方法,设计准则,交互方式以及评估方法。研究者需要通过找到合适的合作者(window),明确他们的角色(cast)。在核心中,研究者需要明确定义问题(discover),然后对数据抽象、设计可视化编码与交互(design),构建可视化系统原型(implement),发布系统获得反馈(deploy)。分析(analysis)包括对之前的分析、设计过程进行反思提高(reflect),完成论文写作(write)。以上步骤并不是完全单向进行的,在每一步中,都需要对之前的流程进行反思与修正。与HCI中以用户为中心的研究不同,问题驱动的设计研究关注数据和任务,通过可视化编码来反映数据特征。

问题驱动研究的设计方式分为3大步骤,共9小步骤

Tamara接下来通过三个不同工作来讲解以上设计研究的步骤。

通过电子商务点击流数据分析消费者行为

对电商点击流数据进行有效分析可以帮助提升网站流量,提高用户留存度和消费额等,具有重要的实际价值。领域专家针对此类数据有不同的问题,比如,用户会经常由哪些页面离开网站?有多少用户完成购买?点击行为是典型的序列数据,专家的问题可以被抽象为如下4个方面:

1. 找到构成有趣行为的序列 (参与忠诚计划的消费者浏览时间更长)

2. 对具体的行为进行区分从而能够不断划分行为序列 (购买者是否可以按照购买时间分组)

3. 对于特定行为有多少序列存在 (网页跳转用户的比例)

4. 在序列中,行为X是否发生在行为Y之前 (用户在购买前已添加购物车)

用户点击流数据分析系统界面

基于以上的任务,该工作设计了交互式可视分析系统。视图A提供了子序列编辑方法,帮助用户分析感兴趣的子序列;视图B记录了分析过的序列以及交互历史;视图C展现了已选序列的统计信息以及关联序列。

利用建筑占用数据进行设施管理和规划

通过建筑内移动设备的WiFi连接数量可以表示建筑的占用情况,对占用进行分析可以提升相关实施的管理、建筑规划等。该研究涉及与空间规划、网络通信、机器学习、可视化等不同领域专家的合作。空间规划专家提出了对于此类数据的任务需求,网络通信专家负责网络连接数据的收集、脱敏,机器学习专家利用历史数据预测未来的建筑使用情况,可视化专家则在此基础上设计不同的可视化形式展现不同地区、不同时段建筑的占用情况。

校园建筑占用分析

大规模物种进化树的比较

物种基因的差异导致了其在进化树上位置的不同。要了解不同基因序列对于物种进化树的影响,需要对大量进化树在不同尺度下进行比较。这项研究设计了一个可视化图标表示单个进化树,在图标中着重展示专家关注的子树在进化树的位置以及差异性。利用拓扑的相似性对进化树进行聚类,从而提高了系统的分析能力。这项研究涉及到大量生物领域的知识,开展过程中与领域专家进行了紧密合作。系统完成后,邀请了5位生物学专家来使用探索自己的数据,验证了系统设计的有效性。

通过可视化图标表示单个进化树

在报告结束后, 参会者就Tamara报告的内容进行了热烈提问。Tamara认为对于学生或者年轻的研究者在开展问题驱动的可视化研究时,应该专注于某一个领域进行深入探索,然后逐步拓宽自己的研究领域。当前可视化的流程还需要进一步优化,现有的方法还难以做到对于每一个流程进行自动化的评估。最后,大会主席西安电子科技大学苗启广教授代表组委会向Tamara赠送了陕西民间传统艺术剪纸表示感谢。

大会主席苗启广教授代表组委会向Tamara赠送礼物表示感谢

圆桌论坛

上午的圆桌论坛由国防科技大学的魏迎梅教授主持,邀请了可视化领域的陈为、王长波和吴亚东教授以及数据挖掘领域的陈伯林、王鑫教授,探讨的是可视分析与数据挖掘领域的交融。首先发言的是来自浙江大学的陈为教授。他介绍的是可视化与人工智能的结合。通过对比可视化与分析的流水线和深度学习的流水线,挖掘它们之间能够相互支持的任务,引出AI for VIS和VIS for AI一系列工作。AI for VIS工作包括tensorboard,计算图优化问题,联邦学习异常检测等。VIS for AI工作包括基于深度学习的散点图排序和推荐,以及仪表盘可视分析系统等。西北工业大学的陈伯林教授以生物医学分子网络探索等案例强调了可视分析对数据挖掘工作的辅助作用。来自华东师范大学的王长波教授着眼于模型驱动的可视分析,交流了将行业知识和感知模型嵌入可视分析的可能。王鑫教授来自天津大学,主要介绍的是可视化和数据挖掘的定义和流水线,以及一些交叉的应用。四川轻工业大学的吴亚东教授认为可视分析与数据挖掘最终都会到达同一条道路,也就是数据分析。两者可以达到一个深度的融合,在原有的数据挖掘流水线的基础之上,将可视化用于数据处理,迭代分析和结果的呈现等方面。

在问题答疑环节,许多的问题指向的是AI for VIS的研究。第一个问题它的研究难点是什么。它的研究难点首要的是在可视化与可视分析的过程中发现任务和问题。提出一个好的问题是成功的一半。第二个问题是如何看待收集训练数据的问题。数据一直是该研究方向非常重要的一个问题。很多时候都没有可用的数据。那么应该如何解决呢?一是可以召集30-50名学生,标记得到一个小的数据集。当然最好是可以通过一个在线的平台广泛地收集用户的数据。还可以通过校企合作的方式,通过企业获取到珍贵的数据集。另外的问题主要考虑的是可视化在数据挖掘研究扮演的角色。陈伯林教授认为目前主要是两个方面。一方面,可视化可以辅助数据分析的过程,帮助用户在中间的过程进行决策。另一方面,可视化可以用于分析结果的展示。

圆桌论坛

下午,多个论文报告、专题讨论等活动并行举办。

艺术项目

2020年中国可视化与可视分析大会艺术项目(China VISAP’20)主题为“数据求真,可视为善”,下设两个分主题,分别为新冠肺炎疫情及文化遗产与非物质文化遗产。本年度艺术可视化展览共收到157份作品,入围6份,入围比例3.82%,此外邀请国内外艺术家作品6份。本次艺术项目学生竞赛共收到380份作品,入围37份,入围比例9.74%,金银铜奖比例为4.74%,作品来自96所高校,共1066人次参加。

龙娟娟老师正在介绍艺术项目合作单位及主席

本次艺术项目的特邀报告邀请到了来自清华大学的吴琼副教授,报告的主题为可视的与可感知的体验。当前,计算无处不在,交互早已超越了传统的二维平面,多通道交互、实体交互的研究与实践越来越受到关注,该报告探讨如何运用可视化的手段与方法进行新交互的设计,如何整合可视的与可感知的设计提供新的体验。具体地,报告以多个项目设计实例讲解论述了从可视的到可感知的体验、设计面临的机遇和挑战、实验和探索三个方面。

本次艺术竞赛的颁奖仪式由来自北京邮电大学的李铁萌副教授主持。本次艺术竞赛共评选出4份金奖,6份银奖,8份铜奖,8份优秀奖,及11份入围奖。

可视化发展年度报告

可视化发展年度报告共有8位老师依次分享。北京大学袁晓如老师首先介绍可视化与自然语言处理交叉研究,通过回顾近几年相关的前沿论文,说明自然语言连接用户和可视化可以有效减轻用户构建的负担,增强可视化的表达能力。第二位讲者是中山大学的陶钧老师,他讲述了深度学习时代的科学可视化,包括科学可视化能够解决什么问题,当前遇到什么瓶颈,机器学习的优势和流程等。机器学习擅长刻画极其复杂的联系,利用机器学习端到端的特性,捕捉参数和输出之间的联系,从参数生成数据/图像,可以把原有的工作做得更好。随后,微软亚洲研究院的王韵博士从三个方面讲述AI for VIS的相关工作,分别是可视化生成、数据故事、数据交互,在分工,通过AI的技术,促进可视化编码、可视化语言、可视化设计参数、可视化设计约束等研究。浙江大学巫英才老师分享的主题是沉浸式可视化。该技术在2014年IEEE VIS首次提出,其具有沉浸感、参与感两个核心特性,在交互更加自然,帮助用户理解三维的数据形态,同时具有多通道感知和可移动性。同济大学的曹楠老师介绍的是异常检测相关工作,他指出目前遇到的瓶颈是“异常和正常没有明确界线”,概念较为模糊,而且标注ground truth的数据少,现有可视化主要集中在异常行为的检测,包括机器的行为、人的行为、社交行为。该领域可以基于信息论、谱分析、机器学习方法检测、追踪、浏览。同时,曹楠老师也指出异常检测领域的研究机会:现有分析个体行为,缺乏协同的行为;主要针对网络数据、时空数据,缺乏文本数据;主要是和领域密切结合的可视化,缺乏本质、通用的异常问题;用户的反馈纳入到异常检测。天津大学的毕重科老师介绍了大规模科学数据的可视化。由于科学问题的公式在数值模拟中存在误差,而可视化能够为领域专家的理论分析提供猜想、验证的依据。毕重科老师带我们回顾了2017-2019年期间,生物医学领域、渲染参数空间探索、动态粒子追踪、体渲染等方面前沿论文。复旦大学的陈思明博士主要介绍社交媒体的可视化,包括地理时空数据、网络数据、文本数据等。社交媒体可视化能对社会事件的反应,灾难应急管理等决策产生重要作用,也能对舆论话题演变与时空关系进行多维度分析,生成故事叙述的可视化,还有文本关键词比较、态度和情感的理解等作用。中南大学的赵颖老师回顾了数据可视分析竞赛的发展、有趣的可视分析题目,以及竞赛报名人员、所用工具的统计数据等,让我们对可视分析竞赛产生浓厚的兴趣。

安全可视分析专题报告

在安全可视分析专题中,三位讲者分享了他们的报告。

来自上海交通大学的董笑菊副教授对网络异常检测可视分析方法进行了报告。以可视分析为基础,根据数据的特点、结合的技术和用户的参与度,讲者对网络异常检测的可能研究方向进行了分类,并介绍了基于增量学习的实时网络异常检测以及基于可视化交互标记的网络异常检测。基于增量学习的实时网络异常检测流程包括特征提取、模式识别、可视化判断调整等部分,能够适用于实施场景的网络安全分析,并结合可视化方法和机器学习方法,利用用户的知识来提高检测效果。基于可视化交互标记的网络异常检测需要用户参与,并进行建议和结果反馈,该方法通过基于fuzzy c-means的算法,根据用户的标记对其他数据进行分类,并计算节点的影响力。同时,讲者强调了与领域专家合作的重要性。

来自奇安信集团的雷尔可视化平台负责人黄鑫分享了多端可视化技术为安全业务带来的创新体验,从平台和框架角度思考业务可视化技术方案。讲者介绍了地图可视化技术的发展历程、分层架构设计、数据可视化的分层、瓦片图层的数据解析流程、多级加速流程以及渲染处理流程等。同时,讲者介绍了如何利用地图可视化平台进行快速的可视化以及分析和交互。在安全业务可视化中,讲者强调了大屏对于决策人员的作用,并介绍了大屏系统的搭建技术。

来自西安电子科技大学的权义宁副教授介绍了网络敏感信息可视分析。网络在带来便利的同时,也为有害信息包括敏感信息的广泛传播提供了便捷。敏感信息包括敏感文字、敏感图片、敏感视频等。敏感文本包括原始文本以及图像中的文本,通过模型进行检测和识别文字。对于敏感图片,利用注意力机制和组内随机游走得到图像特征,结合深度卷积神经网络,实现敏感图像的细粒度分类。对于敏感视频,首先通过关键帧提取得到若干图像,进而将图像输入至敏感文本检测模型与敏感图像识别模型中,从而对敏感图像进行处理。在可视分析中,对网络敏感信息的整体情况进行可视化,分析某个时间段内不同类别的敏感信息的占比情况,并实时推送敏感信息预警,同时对敏感文本、图像、视频等分别进行可视分析。

“网络与图”论文报告环节

“网络与图”论文报告环节包含4篇文章,由电子科技大学的蒲剑苏副教授主持。第一篇工作TS-Extractor从图的拓扑信息和节点属性出发,通过扩充图、计算相关性分数和扩散节点相关性分数三个步骤,来提取具有指定语义信息的子图。该工作以可视化领域的论文引用网络以及合作网络为例,验证了子图提取方法的可行性与有效性。第二篇文章介绍了动态图序列演变模式的可视化,使用图嵌入的方法将图投影为向量,再通过聚类将相似的图划分为一类事件,从而将动态图和事件序列进行对应,得到动态图的事件序列,并对事件序列进行探索分析,从而展示动态图序列的演变模式。第三篇工作提出了TrammelGraph,一种图的简化表达方式,通过优化基于图中节点关联性的损失函数,将图中的节点重新排列至三角形平铺的形式,避免了节点连接图中边之间的交叉的同时,保留了一定的节点连接信息,提高了图对比的效率。第四篇文章从多元网络可视化方法,包括多视图协同、简化表达、点边映射矩阵表达等;多元网络可视化中的交互技术,包括不同视图层级以及数据层级之间的交互;多元网络可视分析的领域应用,包括社交媒体、生物医疗等;共三个方面对多元网络可视分析进行综述。

“可视分析”论文报告环节

“可视分析”论文报告环节包含5篇论文,由华东师范大学李晨辉副教授主持。论文涉及气象卫星数据、城市交通数据、文献数据等来自多个领域的数据,极大体现出可视化研究工作学科交叉的特点。第一篇论文通过模型无关元学习的方法分析由低轨道卫星搜集的稀疏时空数据,以探究区域的昼夜变化和时空变化。第二篇论文探究区域(城市功能块)随时间的动态划分。它将区域栅格化,计算每个格子人群的流入流出规律来完成区域演变研究。第三篇论文针对文献聚类如何选择合适聚类算法、如何解释和评估聚类结果展开研究。基于“资深研究人员通常涉及多个领域研究”的假设,它通过作者文章分布图评估聚类结果。不好的聚类结果可以通过平行坐标剔除不好的特征来改善。第四篇论文通过带有处理内核的CNN模型解决图像对称式检测的问题。该CNN模型加入转化模块和下采样模块,把整体对称特征转换为局部特征,从而发挥CNN的优势。第五篇工作针对传感器数据分析,由实验室魏大同同学报告。该工作通过时间和空间聚合以及单个传感器和区域内传感器原始数据的展示,完成在传感器层次和区域层次的分析。

城市可视分析专题报告

下午的城市可视分析Session,有三位老师分享了在城市可视化应用的有趣工作。

城市问题是国家重大的社会问题。需要智慧城市方案基于时空大数据来高效分析解决城市问题。其中,智能性、实时性、交互性是复杂时空数据的主要需求,利用机器的智能和人的智慧结合来完成理解、推理、决策等任务。这其中面临的主要挑战是数据量大、高维异构、动态演化,对应到可视化是三个方面:动态时序的交互可视表达、异构多维数据的直观可视布局、城市时空数据的增强可视表达。巫英才老师分享了多个可视分析应用,其中主要针对的是城市选址问题,包括有广告牌选址、住房选择、公交路线选择。选址问题面临着搜索空间大、个体需求多的挑战,巫老师提出了最大覆盖算法来快速筛选候选集、位置可达选址计算来计算城市中节点距离,以及混合索引技术来提高计算效率、轨迹拼接算法来剔除冗余的轨迹信息,压缩数据集。

来自北京邮电大学的侯文君老师介绍了基于知识图谱的古都北京文化挖掘和可视分析。北京是文化古都,目标是展示北京背后的大量文化信息内在的关系,以及满足群众的日益增长的文化需求。期望是利用大数据分析和可视化技术从多角度、多视角来处理文化的多面性。具体的思路在于提高语义搜索的能力,并利用知识图谱找到文化实体的联系。首先收集大量的文献文本,进行分词和高频词汇总,确定了主要的文化类别为:建筑文化、满汉文化、京味文学。在确定三大方向后构建了文化数据集平台和知识图谱数据集,总共包含了七千多实体对象,五千多关系数据。最终利用可交互的树图、桑基图、三维网络结构等多样有趣的可视化形式来分别展现北京文化在三大方面的丰富实体及它们之间的联系。

来自同济大学的刘超老师从城市规划的角度带来了不同于可视化专业角度的理解。在新时代,城市规划面临新挑战:城市环境更为复杂、规划标准在提高、时代需求多变。城市数据和城市规划成果展示由信息平台“一张图”完成,其中需要包含城市四维时空特征以及规划方案等等,因此城市规划与计算机技术、可视化技术快速交融合作。

“科学可视化”论文报告

“科学可视化”论文报告环节包含4篇论文,由来自中山大学的陶钧副教授主持进行。第一篇论文针对从体数据有效提取和可视化复杂的目标特征这一任务,提出一种基于高斯混合模型的半自动目标特征提取和可视化方法,用户可以通过在两个体数据的切片上使用套索快速标注单个或多个复杂的目标特征。在医学领域的各种单变量或多变量体数据集上的实验验证了该方法的有效性。由于扩散张量成像(DTI)分辨率的局限性,在追踪过程中需要对扩散张量进行插值以获取连贯的纤维成像。已有方法往往会产生挤压效应与方向的不连续问题,第二篇工作提出了一种基于局部特征的扩散张量插值追踪方法,通过考虑扩散张量各向异性与距离影响来优化各扩散张量主方向的旋转方向。第三篇工作针对并行体渲染提出一种免合成的渲染方法。在渲染阶段,为每个像素创建一个射线-数据交集列表,该列表沿射线识别体数据中非空字块。最后,仅需对不同进程处理的部分图像进行对齐,即可形成最终的输出图像。该方法有效减少了进程间的通信代价。第四篇论文针对集合仿真数据中最常用的集合标量场的可视化工作,从信息提取、趋势分析和可视映射三个维度进行综述和讨论,并提出了现有工作存在的问题和未来可能的趋势。

“多维度数据可视化”论文报告

“多维度数据可视化”论文报告环节包含4篇论文,由之江实验室傅四维副研究员主持。论文涉及语义构建、数值型关联分析、维度划分和可视化构建等方面。第一篇论文通过构建语义轴将模式感知和排序这两个多维属性常见任务结合在一起。选定投影图中两组点,系统会自动形成使两组点区别最大的维度组合。该维度组合可用于数据项排序。第二篇论文对当前数值型关联分析进行改进。它向将连续属性分区后,把分区结果转化为布尔型关联分析的传统分析过程中加入高置信度子区间的反馈机制和聚合等的交互操作。第三篇论文通过维度划分来识别数据中更加细致的模式。划分通过维度内聚类实现。第四篇论文针对表格数据交互构建可视化,由实验室谭绍聪同学报告。该工作支持用户对属性广度优先的探索,提高了数据覆盖率;保留了用户的探索路径,并结合上下文对当前探索路径生成可视化推荐。

艺术家讲座

在艺术家讲座中,六位艺术家分别介绍了他们的工作。来自上海美术学院的蒋飞老师结合虚拟艺术探讨了沉浸式可视化的创作方法,他通过在MIT媒体实验室的相关研究和项目,探索了如何结合多维数据和多媒体去体现创作者的主观感知和经验。来自江南大学的龙娟娟老师介绍了新冠疫情语境下的叙事式可视化研究与实践,他们的疫情可视化作品《流动的边界》深深打动了在场的嘉宾。 来自Errea Comunicación的Javier Errea在线上为我们讲述了在制作信息图时,也需要关注数据背后的人,信息图是一种新闻工作,它通过视觉的方式告诉大家当下在发生什么并帮助大家更好的理解世界。来自四川美术学院的曾真老师讲述了在COVID-19疫情这样的突发性公共事件信息可视化设计中,如何更好地拿捏数据传达的准确度,考虑观者的态度和情感,把控设计目的与意图。来自南京艺术学院的陈皓老师介绍了“功能·流程·形式”三位一体的图形叙事,以及这三大原则在信息图形设计中的应用与体现。来自鲁迅美术学院的张儒赫讲述了数字媒体艺术下的可视化实践。

评论关闭。