标签存档: 数据存储

ConcaveCubes: 支持基于聚类的大规模地理数据可视化 (ConcaveCubes: Supporting Cluster-based Geographical Visualization in Large Data Scale)

城市数据越来越容易获取,且规模不断扩大。现有的信息可视化方法在处理大规模数据时,需要占用大量的存储空间,交互时间过长,并且会由于渲染过多的图元而加重用户的认知负担。

继续阅读 »

TOPKUBE: 一种支持实时时空数据探索的序敏感数据立方体 (TOPKUBE: A Rank-Aware Data Cube for Real-Time Exploration of Spatiotemporal Data)

针对时空数据的查询中一类关于前k相关客体的查询,该论文[1]提出了能达到交互性要求的数据结构及相应算法,解决了相关工作没有关注此类查询或者没有关注可交互性的问题。

继续阅读 »

Nanocubes: 对时空数据的事实探索 (Nanocubes for Real-Time Exploration of Spatiotemporal Datasets)

随着信息爆炸时代的到来,数据量越来越大,人们对时空数据的实时处理和探索显得越加困难。想象一下,假如你有一个微博数据集,它记录每条微博发布的时间、地点和发布设备。那么,你如何可以快速地知道到微博的地理分布呢,是上海还是北京的用户发的微博更多?人们是工作日里发的微博多还是周末发的多?每天微博发布的高峰时间是什么时候?人们用什么手机系统发的微博多呢,是iPhone还是Android?在2009年时候是什么情况呢?那么在2012年这种情况发生了变化吗?这些问题涉及到了各个维度上的聚合统计,并且在时间和空间维度还涉及到了不同的粒度。要回答这些问题,最简单的方法或许是扫描一遍数据集,然后获得统计值。但这在日益增长的数据量和实时性的要求下,这种方法显然不适用。

继续阅读 »