Sequen-C:时序事件序列的多层级概览(Sequen-C: A Multilevel Overview of Temporal Event Sequences)

已有很多有关事件序列的可视分析工作,他们大多从给定用户事件序列的概览出发,并在用户探索的过程中给予细节。但是,现有的相关可视分析系统往往只会给用户单一的概览作为探索的起点,而这可能会遗漏一些发现。系统应允许用户改变概览的详细程度。

而本文[1]则从事件序列的垂直和水平方向提出了构建多层级概览的方法,在垂直方向进行事件序列的聚类,而在水平方向进行事件序列集合不同程度的压缩。此外,对于这些不同层级的概览,用户很难决定从哪一个入手进行探索。因此该工作也提供了一些可能最优的概览供用户进行选择。最后,该工作提出了一个可视分析系统Sequen-C来支持用户多层级的探索。

在垂直方向进行的事件序列的聚类依托于构建的聚类树。首先需要计算事件序列之间的距离矩阵,并类似于哈夫曼树一样迭代地选取距离最近的事件序列对进行合并。如果有k个独立的事件序列,该方法可以生成1-k中任意数量的事件序列集合。

垂直方向的事件序列聚类

对于水平方向,该工作提出了一个方法来进行事件序列集合的压缩。首先,基于此前研究工作提出的方法[2],在每个集合内进行序列的对齐。然后,该工作提出了基于信息熵的计算公式,来计算每一列的信息分数。这个分数衡量了这一列的同质化程度。最后,根据用户指定的阈值,将相邻的低于该阈值的列合并起来。用户可以指定0-1之间任意的阈值,阈值越大,概览越粗略。

水平方向的事件序列集合的压缩

以上的方法提供给用户十分灵活的概览。但是,用户往往不知道如何设置相应的参数。该工作基于平均轮廓宽度准则[3],为用户推荐最优的序列集合数量。序列的平均轮廓宽度越大,对应的集合数量越优。

最后,该工作提出了可视分析系统Sequen-C来支持多级概览的探索。用户可以指定集合数量和阈值大小,或者从提供的最优集合数量中选择。下方便会展示指定条件下的事件序列概览。用户可以选择一个集合,在右边便会展示其中所有独立的序列。用户可以再选择其中之一,下方便会展示其中包含的全部个体序列的具体信息,包括时间信息。用户也可以在左边进行筛选,并查看属性的分布。

Sequen-C的系统界面

[1] Magallanes, Jessica, et al. Sequen-C: A Multilevel Overview of Temporal Event Sequences. IEEE VIS 2021.

[2] D.-F. Feng and R. F. Doolittle. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. Journal of molecular evolution, 25(4):351–360, 1987.

[3] L. Kaufman and P. J. Rousseeuw. Finding groups in data: an introduction to cluster analysis, volume 344. John Wiley & Sons, 2009.

发表评论?

0 条评论。

发表评论


注意 - 你可以用以下 HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>