DecisionFlow:高维时序事件数据的可视分析
论文:DecisionFlow: Visual Analytics for High-Dimensional Temporal Event Sequence Data
作者:David Gotz and Harry Stavropoulos
发表会议:vast 2014
本文使用的数据是由一个美国医疗机构提供的,该数据记录了从客户被接收开始的所有事件,一共有32000个客户,8000种事件类型。每个事件都由三个要素组成,即事件类型、发生事件和发生主体(event type,time,entity),由一系列此类事件组成的数据就是题目中提到的时序事件数据( Temporal Event Sequence Data),而高维(High-Dimensional )指的是事件类型非常多。
本文主要的动机是由于之前的方法都不能处理维度(事件类型)超过20的此类数据,主要由于高维数据在可视表达上容易产生混乱,不便于用户观察、交互。因此,本文主要着眼于解决高维的问题,能对之前提到的医疗数据进行交互、有效的可视分析。
传统上,领域专家对此类医疗数据分析的目的是为了分析某个病症与哪些因素有关。他们的分析过程分为两步:首先,定义一些选择条件对病人进行筛选;然后,使用统计分析软件(SAS)对筛选结果进行分析。本文方法也遵循了这个流程,但是可视编码和交互的定义使得用户无需编程即可快速、高效地进行分析。