
对于安全监测领域,一切重要的对象,包括人、物品、船只、交易记录等,都是时刻地被记录与监测着。他们需要监测这些对象的最新动态,并且判断出哪些对象处于异常状态。然而通常的数据挖掘方法与模型,会根据你的输入,直接给出一个输出,例如,这个人有75%的可能性有某种异常违法行为。然而这种方法并不能让分析人员了解,为什么?是哪些原因让算法做出了这样的判断?但这里传统的算法只能依靠分析人员进行推测了。
生活中很多被记录的数据都有时间信息:信用卡刷卡记录了消费行为、健康测量数据记录某个病人在发病时各项指标系数。传统时序数据可视化可以展示数据值随着时间如何变化,比如观察折线图中曲线的起伏,信用卡消费支出的变化一览无疑。然而,不知你有没有思索过,这些可视化方法是否“准确如实”地传达出测量数据的所有信息?
这里,一篇有趣的论文就指出了这么一个问题,一个极其重要却往往被传统时序数据可视化忽视的现象:大多数的时序数据都是伴随着事件发生,其测量的的频率间隔并不规则,对这类非规律频率测量的时序数据(以下简称非规则测量时序数据)而言,测量频率/测量间隔本身也是一个重要的信息。比如该如何表示缺省的测量值?对于没有测量点的时间段,传统的采用插值的方法来猜测的数值是否会造成误会?
继续阅读 »
近期评论