标签存档: 机器学习

IEEE PacificVis 2021 机器学习和自动可视化专题(Machine Learning and Automated Visualization)

IEEE PacificVis 2021 机器学习和自动可视化专题(Machine Learning and Automated Visualization)以及可视化遇到AI专题(Visualization Meets AI)共报告五个工作,分别是关于将机器学习运用到图布局偏好预测、自动可视化问答、单元可视化的滚动叙述生成、基于图标检测训练对信息图进行解析和总结,以及使用文档嵌入和降维展示主题演变。其中,来自北京大学可视化与可视分析实验室的自动可视化工作ADVISor的具体介绍在http://vis.pku.edu.cn/blog/advisor/

继续阅读 »

P6:一种集成了机器学习的可视分析描述性语法 (P6: A Declarative Language for Integrating Machine Learning in Visual Analytics)

通过Vega [2],Vega-Lite [3]等描述性语法,用户能够快速地定义交互式数据可视化,但是这些描述性语法都没有提供机器学习算法来对数据进行进一步分析。P6 [1]提出了一种新的描述性语法,可以帮助用户迅速构建集成了机器学习算法的交互式可视分析系统。

继续阅读 »

自动可视化注释动画生成

基于文本描述的可视化自动注释

在数据分析过程中,人们会获得各种发现与洞见。当他们分享这些洞见时,可视化图表常常扮演着重要的角色。然而,如何高效地引导观众理解数据,却不是一件简单的事情。在演讲者描述图表的同时,观众需要在图和描述之间频繁切换,并进行视觉和语义信息的匹配。这一过程乏味且耗时,甚至会阻碍观众跟上讲演的思路。

一种有效的辅助读图手段是高亮与注释。针对每一句描述,我们可以高亮被描述的图中实体,并将描述文本附着于实体旁边,从而绑定视觉与语义信息,并快速吸引观众注意力。然而,高亮注释的工作耗时费力,极大地增加了演讲者的工作负担。

针对这一问题,北京大学可视化与可视分析实验室袁晓如团队近期提出一种自动生成图表高亮与注释效果的方法。用户只需上传图表及相应的描述,即可在顷刻间获得准确而生动的、带高亮与注释效果的动画,以辅助数据信息的展现。这项成果发表于ACM CHI 2020。

继续阅读 »

The What-If Tool: 机器学习模型的交互式探测(The What-If Tool: Interactive Probing of Machine Learning Models)

在这个可解释的机器学习时代,仅仅进行模型训练并从中获得预测的结果已经无法让人感到信服。 为了能够真正获得良好的结果,我们还应该能够探究我们的模型。探究一个模型需要问很多问题,例如探测模型中的问题和矛盾,这样的任务通常是复杂的并且需要编写大量的自定义代码。What-If Tool [1] 这个工具能够轻松、准确地解决这个问题,使它更容易为平常的用户来探究、评估和调试他们的机器学习系统。

继续阅读 »

IGAL可视化讲习班-1:从易用到自动,大数据可视化的下一个十年 – 袁晓如

2018年12月26日,由中国图象图形学学会主办,CSIG可视化与可视分析专业委员会、北京大学机器感知与智能教育部重点实验室、北京大学大数据分析与应用技术国家工程实验室联合承办的主题为“可视化与可视分析前沿进展”第9期CSIG图像图形学科前沿讲习班在北京大学举行。第一次课程由北京大学袁晓如研究员讲授,题目为《从易用到自动,大数据可视化的下一个十年》。十年来可视化在中国发展迅猛,其中数据科学兴起对可视化产生推动作用。在计算机领域,计算能力、大数据、人工智作为三驾马车,极大推动了计算机相关学科的发展,同时也在推动社会的前进。数据科学离不开人和机器,机器拥有着强大的计算存储能力,而人类则更擅于创造,人类和机器具有不同的长处,可视化关注如何让将人和机器的长处结合,解决科学问题,将在其中扮演关键角色。 继续阅读 »

自动可视化生成系统:Draco(Formalizing Visualization Design Knowledge as Constraints: Actionable and Extensible Models in Draco)

本篇工作[1]介绍了一个自动生成可视化的系统Draco。用户需要输入数据集和简单的数据描述,然后根据自己的任务,输入需要编码的数据,可以指定编码的方式,Draco通过计算,得到一个优化的结果,最后通过Vege-Lite生成可视化。下图为一个简单示例。

继续阅读 »

2018年北京大学可视化暑期学校 – Day 1 (2018年7月17日)

前一天刚参加完精彩的北京大学可视化发展前沿研究生暑期学校十年特别峰会,暑期学校的学员们就在7月17日投入到了紧张而充实的全面学习中。今天的暑期学校邀请的讲者是香港科技大学的屈华民教授和马里兰大学帕克分校的Leila De Floriani, Hanan Samet两位教授。三位老师结合各自所做的工作,从不同的角度向同学们展示了可视化的魅力。 继续阅读 »

基于深度生成建模的数字墨水可编辑化研究(DeepWriting: Making Digital Ink Editable via Deep Generative Modeling)

数字墨水有望结合手写的灵活性和美感,并且可以处理、搜索和编辑数字文本。在已有的工作中,字符识别将手写文本转换为数字表示,这将会损失个性化特征。同样的文字在不同人的笔触下会产生不同的结果,这些结果蕴含了用户的书写风格。此工作提出了一种新的神经网络架构,将内容和风格进行分离。从而使得书写结果可以在机器上得到编辑:包括改变书写风格或者内容。

对一个手工书写可以分解为两部分,内容和风格。如上图所示,手工书写表示成为x,可以分解成为风格z和内容π,如果可以对其进行划分,就可以将一个书写的风格和另一个书写的内容相结合构成新的书写。这样就达到的可编辑的目的。

继续阅读 »

喷气机引擎模拟数据之原位预测驱动特征分析(In Situ Prediction Driven Feature Analysis In Jet Engine Simulations)

在喷气机发动机转子中,局部气流不稳可能会对发动机产生不可逆的损坏,这种局部气流不稳称为滞障(Stall)。发动机运行过程中,相关领域的专家希望观察气流滞障的产生过程以及实时观测探究不同参数设置对滞障产生过程的影响。本工作主要探究的参数设置为矫正块流率(CMFcorrected mass flow rate)。

滞障没有明确定义及解析表达,判断某区域是否处于滞障状态只能依靠专家的经验知识。而依靠人力进行判断在大规模数据多时间步实时探究的要求下不可行。因此本工作提出了预测驱动的特征分析。在此预测驱动是指通过机器学习方法,学习专家对滞障状态的解析表达的判断。

继续阅读 »

Podium:用混合驱动的可视分析对数据排序(Podium: Ranking Data Using Mixed-Initiative Visual Analytics)

对数据进行排序是数据分析中基础的操作之一。人们使用排序来理解大数据集中最重要的元素、根据数据属性进行决策、或者给原本没有排名的数据增加排名以表达某种含义。例如,人们会按照统计数据给球队排名,会根据电影的特性或者票房给电影排序等等。人们也会将一些排名和自己的认识进行对比,例如球队的粉丝可能希望理解专家发布的排名是基于什么样的准则。

继续阅读 »