Home > 论文评述 > 利用嵌套平行坐标图进行多分辨率气象数据集合的参数分析

利用嵌套平行坐标图进行多分辨率气象数据集合的参数分析

利用嵌套平行坐标图进行多分辨率气象数据集合的参数分析

Multi-Resolution Climate Ensemble Parameter Analysis with Nested PCPs

会议: VAST2016/ Session Machine Learning

作者: Junpeng Wang, Xiaotong Liu, Han-Wei Shen and Guang Lin

系统截图如下

一、气象预测数据集及相关问题简介:

气象学中, 对流是降雨形成原因。 给定一个大气状态和大气移动参数的值(对流参数),根据已有信息迭代地运行模拟来得到下一个时间段的状态。 一般将感兴趣的空间区域离散化划分成一块块网格,在这些网格上迭代计算,计算下个时间段的状态,网格大小即是分辨率。为了提升准确率,会采用不同参数调节机制,这样就导致了多组参数;另在不同的分辨率下模拟可捕捉不同尺度下的特征,导致了 多分辨率时空气象ensembles这样的数据集。

在相关领域研究中,这样的预测模型有一定的局限性:模型对于参数设定与分辨率都很敏感,高分辨率模型不一定总比低分辨率的好、而且计算开销不同,分辨率越精细开销越大。为此,领域专家需要分析一些问题,来应对这样的局限性。比如:不同参数之间的关联(correlation);这样的关联在不同分辨率下是否可转移(transferable);对流参数和时空模拟ensemble数据(输出)间的关系。

为了方便叙述,我们做一些概念的正式定义:

Ensemble集(Ensemble Set)

  • 一次模拟的运行输出包含了多天的预测结果,单天的结果称为ensemble item。
  • 多天的构成一次运行的输出结果称为ensemble member。
  • 多个ensemble members构成ensemble set(简称ensemble),会有不同分辨率。
参数集(Parameter Set)
  • 一次模型运行中,由不同对流参数的值组成的一组值称为参数设定。
  • 一个ensemble中采用的一批参数设定被称为一个参数集。

观测集(observation set)

  • 卫星观测到的特定区域的在一段时间上的天气,每天是一个观测项(observation item)。
  • 同样可以有不同分辨率。
        在此基础上我们定义更具体的分析任务,其中R1~3针对于参数可视化、而R4~6针对于Ensemble的可视化。
  • R1 集内参数关联(intra-set parameter correlation)
  • R2 集间参数关联(inter-set parameter correlation )
  • R3 高维参数范围查询
  • R4  Ensemble item和ensemble member的质量评估
  • R5  Ensemble member的比较
  • R6 展现ensemble的时空方面的特性

 

二、系统概览:

系统结构清楚,各视图分工明确,其中有三个主要视图:嵌套平行坐标、概览视图、地理信息视图。

可视分析系统架构

三、可视设计:

文章首先将一些常见平行坐标图列举,针对本文分析问题,陈述各自优缺点(他们用的是同一种人造数据),如下图:

本文提出的嵌套式平行坐标 (NPCP), 则结合了他们的优点, 避免了他们的缺点. 其设计上也比较细致, 比如颜色、透明的自定义、实时范围查询的支持 交互上也做的很周到.

对于概览图,分为两块:Heatmap展示天气预测的质量评价、 dendrogram展示ensemble之间的关系。

其中质量评价是与观测集比较的,每个ensemble item有一个准确度的值,每个ensemble member是一个准确度向量。而在dendrogram中,首先有了准确度向量结合Dynamic Time Warping计算ensemble member之间的关系,这样计算出一个对称的距离矩阵,对于这个用自底向上的层次聚类。这些视图都是可以互相联动的,并且与NPCP也是互相关联的。

最后还有一些地理信息视图,从ensemble item和ensemble member的层面来展示上面预测结果与地图结合的可视化结果。

四、案例与专家评价:

文章用了2007年6月某地30天的数据 (如下),其中专家感兴趣的有5个。结合这些数据,有一些比较浅显的case,这里不再 复述。

专家评价如下(比较常规性的评价)
  • NPCP / heatmap + dendrogram都获得好评
  • 两者间互动构建了参数和ensemble之间的关联
  • 可以泛化至其他类似应用场景

局限性:

  • 在某些条件下可视化结果会显得复杂
  • 学习曲线略陡
  • 数据量太大时仍有视觉混乱

 

五、个人想法:

解决的问题看似不难(其实也算是个老问题),但其实文章抽象概括的很好,并把可视化很好的套上去;提出的分析任务也是很完备。设计上尽管有些细节可能略奇怪,但总的来说还是十分细致,并且交互简洁而实用。文章的语言描述也很完备。在系统评估方面,篇幅比较少、也未给人耳目一新的感觉。

分享到:

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>