作者存档: Ma, Nan

Hashedcubes: 对于大数据的简洁,低存耗,实时的可视探索 (Hashedcubes: Simple, Low Memory, Real-Time Visual Exploration of Big Data)

交互式可视化系统的设计者现在正面对着大规模、多维度的数据的挑战。这一工作为以下问题提供了一个肯定的答案:是否存在一个简单的数据结构为一个更成熟的索引提供更丰富的性能,同时使空间消耗相对较低、执行方法较为简便?

继续阅读 »

对于机器分析和人类分析在分类中的解析 (An Analysis of Machine- and Human-Analytics in Classification)

这项工作跟踪在两个可视化分析应用中的技术和认知过程,并归纳为一个应用软知识的共同理论模型,可以添加到建立一个决策树模型的可视化的分析过程中。 继续阅读 »

Squares: 支持多类别分类器的交互式分析展示(Squares: Supporting Interactive Performance Analysis for Multiclass Classifiers)

对于机器学习来说,对分类器的表现进行分析是很关键的,因为它会影响到应用模型的人的产出。例如,应用模型的人在决定使用哪个参数之前,总是比较不同模型通过不同算法参数产生结果的表现。现在比较流行的工具有两种,第一种是统计学上的总结,例如准确度、精确度、召回率或对数的损失;第二种是混淆矩阵。

但当前的这两种工具也存在一些问题,第一是与原始数据缺乏关联;第二是会掩盖数据中的重要信息,例如分数的分布;第三是对于多分类分类器的支持是很重要的,而现有工具不具备这个功能。

继续阅读 »