The Connected Scatterplot for Presenting Paired Time Series
论文:The Connected Scatterplot for Presenting Paired Time Series
作者:Steve Haroz, Robert Kosara, and Steven L. Franconeri
发表会议:TVCG 2016
一、简介
Connected scatterplot(后文中简称CS图)在数据新闻领域经常被用于可视化一对时序数据序列。CS图的最初使用案例之一是纽约时报上的一篇关于室友价格和销量的新闻。由于在大数据样本下,CS图会产生非常复杂的模式而难以理解,因此它往往用于展示任务,而非分析任务。本文主要通过四个用户调研的过程,对CS图和以DALC图(双轴图,具体介绍见下一节)为代表的其他用于可视化一对时序序列的方法进行对比评估,探究CS图与DALC图在关于模式理解等任务上的优劣性。
二、CS图
常用的DALC图(左,双轴图)用横轴表示时间,左右两个竖轴分别表示两个序列的刻度,两个时序序列在DALC图中用两条折线表示。CS图(右)则分别使用一条横轴以及一条竖轴表示两个序列的刻度,图中每个点对应一个时刻,点的横纵坐标分别对应两个序列的刻度,点与点之间用标示顺序的线连接,标示时间的先后顺序。CS图中常出现以下两种模式:
L型(上)和环形(下)。其中,L型的典型特征为线条发生90度角的变化,说明这个变量对之间的关系突然发生了明显变化。例如一个变量不发生变化,另一个增加或者减少;环形则表现出交叉的特征,表示两个时序数据之间出现了时间偏移。一个时序序列的局部最高值对应另一个序列的最低值,并且维持一个周期才能产生一个环。
上图为CS图中典型的有两个变量变化相关性决定的点的移动方式,每队图的左边为DALC图,右边为CS图。这些典型的点对特征包括:a)两个变量均不发生变化,表现在CS图中为点不发生任何移动和变化;b)两个变量中只有一个变量发生了变化,表现在CS图中为点在平行于坐标轴的方向上移动;c)d)两个变量具有正相关和负相关的变化关系,表现在CS图中在坐标轴上的倾斜角度上变化。
三、user study 1 A
- 目标:对CS图的理解程度的定性研究
- 14位被试:本科
- 两个数据:行车安全、军队数据
- 形式:非正式访谈
- 过程:14名被试分为两组,每组各7人,均要用到两个数据,先是行车数据再是军事数据。在展示每组数据的DALC图以及CS图时,先给出关于这组数据的问题,然后看图,看完以后回答问题。第一组被试在看图的先后顺序上为先看DALC,再看CS;第二组反之。
- 问题:6个开放性问题,有关形状、初始理解、两个轴变量的总变化等等;7个趋势描述问题,描述高亮的时间段的变化趋势(包括相关性变化);2个情境问题,根据图判断给定语义是否正确。
- 结果:问题正确率非常高,被试在两种图中均发现明显特征(X,L,Loop等)。但是容易产生两个思维误区,两个图中关于相反趋势的映射是完全不同的以及CS图的横纵坐标均表示变量的值。
- 目标:语义陈述转化为CS图、DALC图的量化研究
- 14位被试:本科
- 两个数据:行车安全、军队数据(修改)
- 形式:非正式访谈
- 过程:每个被试都回答若干个个问题,将语义转为CS图或者DALC图中的趋势线。
- 问题:9个明确陈述问题,8个情境描述问题。
- 结果:DALC图的正确率偏高;CS图反向阅读困难;CS图Y1, Y2均无变化时容易引起困惑。
- 目标:两种图互相转化时产生的方向性困惑研究
- 35位被试:亚马逊MTurk平台招募
- 每个被试:45min
- 形式:在线回答问题
- 过程:CS图与DALC图之间和之内互相转化。每个图包含五个点,用户要将给出的图转化为另一种要求的图形式。任务包含了每种图各自的重要特征。
- 结果:DALC图转DALC图的正确率为100%,其他转换中均会造成时间顺序相反、x轴方向相反等错误。
- 目标:CS图的对用户做任务的吸引力研究
- 25位被试:在校学生
- 6种数据
- 形式:眼动数据记录
- 过程:每个用户浏览一行6个视图,每个视图在保留总体结构的基础上尽可能小,隐藏细节。用户可以选择感兴趣的小图点开观察5min之内的任意长的时间。
- 结果:用户刚开始均被CS图吸引,但用户对于DALC图和CS图的全部观察时间之和非常接近。
七、总结: