
成对比较问题很常见,它可以帮助我们进行类比推理、社会比较、决策以及知识发现。然而,我们经常是在比较苹果和橙子(compare apples and oranges)——两个感兴趣的东西不易比较。比如比较北京和纽约,这两个城市在很多方面都有不同之处。本文 [1] 旨在系统地研究成对比较问题。作者们提出了成对比较的分类,开发了一个电子表格应用程序Duo以帮助人们完成成对比较。此外,他们还研究了用马虎规则(sloppy rules)和自然语言来指定成对比较问题的不同。
随着机器学习技术的日益普及,人们对使机器学习系统更加透明和可解释的研究兴趣激增。研究者们已经开发了各种可视化以帮助模型开发者理解,诊断和改进机器学习模型。然而,大量潜在但被忽视的用户是领域专家,他们对机器学习知之甚少,但预计会与机器学习系统一起工作。本文作者提出了一种交互式可视化技术,以帮助在机器学习方面缺乏专业知识的用户理解,探索和验证预测模型。通过将模型视为黑盒子,作者从其输入 – 输出行为中提取标准化的基于规则的知识表示。然后,作者设计了RuleMatrix,基于矩阵的规则可视化,以帮助用户导航和验证规则和黑盒模型。作者通过两个用例和一个可用性研究来评估RuleMatrix的有效性。
图1:电影Jurassic Park和The Moon and Sixpence的故事线可视化: (a)和 (b)为手绘版本, (c)和 (d)为iStoryline绘制的版本; (e)和(f)为StoryFlow自动生成的版本.
故事线可视化技术(storyline visualization techniques)在自动生成复杂故事对应的插图这方面取得了显著进展。虽然其性能有所提升,应用领域得到扩展,但是故事线的视觉布局没有因此得到增强。现有方法的优化目标包括减少空白空间、最小化线条交叉和摆动等。然而,与手绘的故事线相比,追求这些优化目标并不能产生最佳的结果,会产生布局重复、情节缺失等问题。为解决这些问题,作者实现了iStoryline工具,通过将用户的交互集成到自动生成技术的优化算法中,在手绘故事线和自动布局之间实现平衡。
随着成像技术的快速发展,TB级别的超大规模的体数据逐渐频繁地出现在科研和产业界中。再加上近年来先进的体数据自动切分标注技术的出现,超过百万量级的密集标注的体数据已经能够生成。这样密集的标注方式,如32-bit的整数标注,又进一步增大了数据的体量。巨大的数据给对于切分标注数据的交互式可视化和可视分析带来了巨大的挑战。一方面,针对这样的数据生成高效的多分辨率层次结构十分困难,如何对于多分辨率层次结构的体数据匹配地进行标签的采样与生成需要新的技术。另一方面,对于特定的数据切块的查找和定位,十分费时费力,需要新的高效的数据组织方式来进行存储和访问。本文提出了一种新的数据管理的方式,可以有效地助力对超大规模切分体数据的剔除。
近期评论