利用可视化进行隐私保护

这次我们讲一下Dasgupta, A的一系列工作,主要是关于利用可视化进行隐私保护的话题。这是一个有意思的话题,因为我们平时所说所用的可视化,经常会有不经意地带来的信息损失,使我们获得的信息具有一定的不确定性(包括映射信息本身以及人解析认知信息的过程)。这样的信息损失在通常的可视化设计与可视分析中都是被认为不好的,而作者从另一个角度出发,对于隐私保护而言,可视化带来的不确定性却可以是一个好处。

1pppc

基于此,作者提出了基于k-anonymity,l-diversity的用于隐私保护的可视化设计[3]。隐私保护的目的是在提供对数据的整体特征、趋势、相关性的分析前提下,对个体信息进行保护,并且对一些隐私的属性与数据维度进行一定的保护。从基本定义来说,k-anonymity是对每个轴进行视觉聚类(visual clustering),每个聚类至少k个数据,因此这样保护了个体信息。另外一方面,为了防止闭包攻击,对于一些重要隐私的维度,当用户交互选择了子数据集时,保证了隐私维度的l个不同的值会同时会被高亮。也防止了用户从多个方面进行交互筛选进行攻击探索隐私数据。

2pipeline

隐私的保护从本质上来说是通过提供数据与认知的不确定性来完成的。因此作者也在理论层面,对视觉的不确定性,从数据编码与解码的两个方面,根据原始的数据可视化流水线,提出9大不确定性的来源。这里仅列出这9大分类,具体请参考文献[4]。首先在数据编码方面,从数据映射的角度看,完整性(completeness)与配置(Configuration)是两大不确定性的来源,可能由于数据的筛选、数据项的选择等。从视觉映射角度来看,精确性(Precision)与Granularity(细节粒度)也是两种不确定性的来源,基本是由于视觉映射中多个数据映射到相同像素bin中导致的,或者多个数据混合无法确定其中具体条目的数量。另外一个大的方面,就是感知的过程中,会有人对空间感知的误差,对数据的跟踪度(Traceability),对个体的特征把握(Identity)方面导致不确定性。而在认知的过程中,由于分析人员缺少知识和数据复杂,也会导致不确定性的产生。

3table

在对于不确定性有一定的深入研究之后,作者又将之前的隐私保护的讨论提出了基于不确定性的更加深入的分析。进一步而言,隐私(安全性)和可用性始终是一对矛盾,如何量化隐私保护的程度(同时也是可用性的程度),也是一个重要的议题。因此在[5]中,提出了一些列基于不确定性的评判标准(metrics),具体包括聚类总体误差(Cluster Summary Error)、聚类范围(Cluster Range)、聚类重叠度(Cluster Overlaps)等,还有一系列基于信息论的评判标准,包括重叠熵(Overlap Entropy)以及互信息(Mutual Information),基于信息论的理论基础考虑了攻击者对数据值的本身了解程度,以及相邻的维度之间互相的推导关系。在此之外,还有包括与l-diversity相关的平均分割数(Average Split Count)以及基于Pargnostics的测量。具体相关的测度计算以及一个案例也请参考文献[5][1][2]。

在这里,把Dasgupta,A等人的相关研究工作,通过不确定性和隐私保护相结合,以平行坐标等高维数据分析为载体的一系列研究串起来,与大家共同讨论与分享。

[1] Dasgupta, A. & Kosara, R.Pargnostics: Screen-Space Metrics for Parallel CoordinatesVisualization and Computer Graphics, IEEE Transactions on, 2010, 16, 1017-1026
[2] Chen, M. & Jäenicke, H.An Information-theoretic Framework for VisualizationVisualization and Computer Graphics, IEEE Transactions on, 2010, 16, 1206-1215
[3] Dasgupta, A. & Kosara, R.Adaptive Privacy-Preserving Visualization Using Parallel CoordinatesVisualization and Computer Graphics, IEEE Transactions on, 2011, 17, 2241-2248
[4] Dasgupta, A.; Chen, M. & Kosara, R.Conceptualizing Visual Uncertainty in Parallel CoordinatesComp. Graph. Forum, John Wiley & Sons, Inc., 2012, 31, 1015-1024
[5] Dasgupta, A.; Chen, M. & Kosara, R.Measuring Privacy and Utility in Privacy-Preserving VisualizationComputer Graphics Forum, 2013, 32, 35-47

评论关闭。