将可视化与文本叙述结合能够很好地完成数据故事叙事任务。数据视频包含了丰富的数据信息,能够增强观众的参与感,并提高他们对于数据事实的理解和记忆。因而,数据视频成为了广受欢迎的数据故事叙事模式。然而,创作数据视频的门槛很高。一个高质量的数据视频要求制作者理解视频叙事方法,了解可视化设计与可视分析探索方法,并掌握视频制作技巧。这篇文章中,作者提出了一种能够自动化从静态可视化以及对应的文本叙述构建数据视频的方法框架,来降低数据视频的制作门槛。

将可视化与文本叙述结合能够很好地完成数据故事叙事任务。数据视频包含了丰富的数据信息,能够增强观众的参与感,并提高他们对于数据事实的理解和记忆。因而,数据视频成为了广受欢迎的数据故事叙事模式。然而,创作数据视频的门槛很高。一个高质量的数据视频要求制作者理解视频叙事方法,了解可视化设计与可视分析探索方法,并掌握视频制作技巧。这篇文章中,作者提出了一种能够自动化从静态可视化以及对应的文本叙述构建数据视频的方法框架,来降低数据视频的制作门槛。
因果分析是人们理解与解释不同事件之间关系的过程。人们通过因果分析来解释已发生的事情,预测未来的事件,并帮助进行决策。然而事实表明,单人进行因果分析可能面临各式各样的挑战,各类无意的偏见,如确认偏差(Confirmation Bias),锚固效应(Anchoring Effect),框架效应(Framing Effect)等等,都会给结论带来偏差。另一方面,已有工作表明,虽然引入他人观点能够极大程度地帮助用户发现他们的认知盲点,但同时也会引入其他的偏差,包括从众效应(Conformity Effect),多看效应(Example Exposure Effect),逆火效应(Backfire Effect)等等。因此,研究者们需要了解当众包观点被提供给用户时,对于因果分析会产生哪些影响,以及用户会如何结合地使用数据分析技术和众包观点。
继续阅读 »为了让用户更快更好地熟悉和使用复杂的系统,可以使用自然语言代替传统的用户交互界面。这一类交互界面被称为自然语言界面(Nature Language Interface),并已经被广泛地在各类可视分析系统中使用。相比之下,很少有工作将这一技术应用在构建可视化的系统中。事实上,无论是分析导向的系统还是构建导向的系统,在工作流程上有极大的相似之处。下图展示对比了将自然语言处理技术应用在两类系统中的具体流程。
继续阅读 »作为人类46条染色体中较为特殊的一个,Y染色体仅会父子相传的特点,使得人们可以通过研究Y染色体的遗传进化过程,了解人类父系族群的发展与迁徙。人类Y染色体谱系树即是通过Y染色体单倍型类群,整理出的Y染色体进化树。在这棵树上,根节点是在遗传学上理论上认定的人类父系共同祖先亚当,而每个分支节点则都代表着该节点下各个进化分支的公共祖先。
继续阅读 »如图是一个具有多视图的可视化系统,用于帮助探索宋代四位诗人在其人生的各个阶段的行程轨迹,以及文学创作,从多个角度分析诗人的一生。该可视化系统可以被放置在博物馆等场景中,作为面向大众的可视化案例。利用其高交互性和丰富的内容,以独特的形式帮助大众了解相关的领域知识。
中国的图书分类历史源远流长,唐初官修目录《隋书 · 经籍志》是第一部正式使用“经、史、子、集”四部分类法进行分类的目录。除《隋书 · 经籍志》外,《旧唐书 · 经籍志》《新唐书 · 艺文志》《宋史 · 艺文志》也都是官修史书的图书分类目录,不仅在时间上具有连续性,也延续了 “经、史、子、集”四部分类法。另有一部《日本国见在书目录》,记录了日本国平安前期为止的传世的汉籍总目录。该书借鉴《隋书 · 经籍志》,成书虽晚于 《隋书 · 经籍志》 ,却早于《旧唐书 · 经籍志》,所著内容与国内官修史书目录可以相互补充,同样具备极高的研究价值。 通过对这五部目录的研究,可以窥得我国古代书籍分类之一隅。
继续阅读 »针对网页样式的修改工具通常停留在代码层面,如直接修改HTML,CSS或者JavaScript代码文件。也有一些工具进行以一定程度的封装,实现了部分较为底层的操作。然而,这两种修改网页样式的方法对于没有编程基础、设计基础的新手来说是难以掌握的。新手难以将他们的高度抽象的目的转化为底层的基础操作,更难以找到需要修改的属性。因此,该工作尝试通过自然语言的交互方式,半自动地帮助新手完成网页样式的修改。
继续阅读 »研究者常用数据文档来记录在进行数据探索中的各种发现。尽管目前已经有相当多的工具可以被用于进行数据探索,但是针对帮助进行数据文档编写的工具仍然很少。研究者们仍然需要通过手动的方式记录和维护数据文档。于此同时,一旦数据本身发生更新,对应的数据文档就需要进行修改;由于缺少对应的工具,手动地对数据文档进行修改和维护始终是一件乏味且容易出错的事。为了解决这个问题,来自加州大学圣地亚哥分校的研究者们提出了CrossData,通过自动识别数据和文本之间的关系,来帮助对数据文档的编写。
继续阅读 »社交媒体平台上每时每刻都在发布各个领域的相关新闻、报告等信息,这些信息对于领域专家来说,往往具有极高的研究价值。而然,社交媒体数据的巨大规模以及极高的更新率对于分析工具提出了巨大的挑战。已有的相关工具有相当大的局限性——大量的分析系统仅仅支持事后的分析,因此缺失了社交媒体数据的事实性;支持实时分析的数据往往又难以支持大规模数据的涌入。还有一些工具依赖于额外的元数据,例如地理空间数据。近年来,包含这类元数据的社交媒体数据的比例不断下降,导致类似的工具的实用性越来越低。
继续阅读 »
近期评论