ColorMapND: A Data-Driven Approach and Tool for Mapping Multivariate Data to Color
论文:ColorMapND: A Data-Driven Approach and Tool for Mapping Multivariate Data to Color
发表: 2018 TVCG
作者:Shenghui Cheng ; Wei Xu ; Klaus Mueller
简介:本文提出了一种用于将多元数据映射到颜色的数据驱动方法和工具。
动机
目前为止几乎没有支持将多元数据到颜色的研究,已有的一些方法能够将低维数据映射到颜色,但只支持2~3个变量。
系统界面
系统由四个视图构成,Color Legend(本文方法生成的调色板), Pseudo Colored Plot(着色图),Local Enhancement(对选择区域进行对比度增强)和Channel View(对单个属性分布着色)。
基础框架
基本任务
- 数据样本间的相异性可以通过颜色来感知。
- 属性间的相异性可以通过颜色来感知。
- 将数据样本与属性之间的关联表示为可感知的颜色标记
解决方法
1. 任务一和任务三可以通过RadViz来解决,由于Radviz的特性,数据样本 越相似,布局位置肯定越接近;数据样本某个属性的值相对越高,它与边缘上的属性点位置也会越近。任务二通过一种新的基于相似性的属性排序和间距来解决,通过哈密尔顿回路 对属性进行排序 ,根据属性相关性 确定 间距。
2. 三大基本任务中相异性都需要通过颜色来感知, 这一过程的基础是需要一个精确的色彩空间。这个色彩空间需要符合以下3点要求:
- 感知均匀;
- 圆盘形状;
- 颜色空间的色调饱和度切片应该是等亮度的。
CIE HCL (Hue Chroma Luminance)符合了以上要求,但在显示器所用的sRGB色彩空间环境下只能显示部分色彩,因此需要在可见部分中找到最大直径的CIE HCL切片来作为ICD中使用的色彩空间。
其他功能
多元着色插值
Adaptive kernel density estimation(AKDE)是核回归(kernel regression)方法的一种,是使用核函数对数据进行非参数估计(nonparametric estimation)的回归模型。本文对着色图根据数据样本进行AKDE插值讨论了三种策略:
-
先着色,后插值(效果不好,颜色偏差)
-
先插值,后着色(布局过程需要不断迭代,初始位置丢失,代价昂贵)
-
先插值,根据插值计算权值来着色(Nadaraya-Watson回归)
案例分析
America’s Mood Map
从华盛顿和俄勒冈州来看,这两个州的人性格非常相似,但与相邻的加州却有很大的不同,主要的区别是外向。另一方面,蒙大拿州是一个相对“正常”和“和平”的州——它在所有属性上几乎是平等的,值也很低。
总结
- 通过ICD,可以得到多元数据的着色方案。
- 颜色能在一定程度上表现数据样本的组成和相关性。
- 颜色对数据相关性的表达未定量地评估。
- HCL空间和sRGB空间不能完美覆盖。