[论文快速浏览]VAST 2014: Clustering & Classification
文章列表:
文章列表:
论文:ConTour: Data-Driven Exploration of Multi-Relational Datasets for Drug Discovery
作者:Christian Partl, Alexander Lex, Marc Streit, Hendrik Strobelt, Anne-Mai Wassermann, Hanspeter Pfister and Dieter Schmalstieg
发表会议:VAST 2014
在现有的医药、化学领域探究多种关联性信息的研究中,由于数据尺度、关联性复杂等问题,快速探究多关联性很有难度,本文设计了名为ConTour的针对探索复杂、多关联性数据的交互性可视分析技术。用于探究在药物探索中,对药物潜在有效性和安全性的研究工作。
系统在功能上是对个体项目进行一系列属性关系的重排序;利用列嵌套、筛选等交互在表现具有父子关系的关联信息的交互,通过关系视图表达列与列之间的关联性的强弱、数据丰富的属性;通过细节视图同时表达多个数据集之间的多个个体的关联关系。
本文的相关工作分为三个部分:
1.Graph Exploration:Jigsaw、GraphTail
2.Faceted Browsing:InfoZoom、FOCUS
3.Pharmacology visualization: 相关的医药研究领域的可视化工具
本文的系统设计基于医学上的Biological Fingerprints(基因指纹)的概念,用来记录能够作用在细胞或者有机体上的分子和反应过程。设计的目标需求由相关专业领域的专家们提出:1.系统可以表现药物的反应机制;2.系统可以表现药物机制的生物反应流程;3.系统能够观察到在特定的治疗方案中新药品的潜在效用。
系统的数据是医药公司提供的大规模尺度的Pathways数据,从中我们可以提炼出相关的Gene,Compunds,Fingerprints,Therapeutic Groups数据集,用于探究其中的关联信息。
论文:TenniVis- Visualization for Tennis Match Analysis
作者:Tom Polk, Member, IEEE, Jing Yang, Yueqi Hu, and Ye Zhao.
发表会议:infovis 2014
在现有的对网球比赛的可视化工作中,做的比较多的是对网球轨迹数据和球员跑动轨迹数据。但是这些数据的收集成本都非常高,要求比较高精度的摄影设备和很多其他的人力物力。另外一些可视化工作则是纯粹展示比赛双方的技术统计,用户并不能从这些可视化结果中看到比赛的发展趋势。而本文提出的TenniVis可视化系统只需要用到一些比较容易收集到的数据,用两种简明易懂的视图展示比赛全过程,显著地提高用户观看比赛的效率。系统还提供从盘、局、分这几个级别上的过滤操作,让用户快速筛选出自己感兴趣的比赛片段并从这些时间点切入观看比赛视频。
论文: Domino-Extracting,Comparing,and Manipulating Subsets across Multiple Tabular Datasets
作者: Samuel Gratzl, Nils Gehlenborg, Alexander Lex, Hanspeter Pfister and Marc Streit
发表会议:VAST2014 INFOVIS
导引:
介绍一种名为Domino的表数据的多形式可视化技术, 用于表示数据集的子集以及子集间的关系. 该技术给使用者提供了一套对子集进行排列组合和抽出的综合工具, 可以让用户实现常见的普通可视化形式以及针对特殊案例的高级可视化形式.
Domino最核心的两个组成部分是块(blocks)和块关系(block relationship).
详解:
1.块有如下三种分类型, 数值型, 矩阵型. 分类型诸如性别分类:男 女两种. 数值型如 不同歌手唱片数量, 一个小矩形代表一个歌手. 矩阵型中, 两个item type可以一样可以不一样: 如果两个都是同样的城市名称, 那么就可以用此来表示距离矩阵; 不一样可以表示如不同病人的癌症基因表达. 排序: 数值型中是根据数据的值; 分类型中是根据不同group分类被赋予的值,group内部无序的; 是根据两个维度items均值来, 按亮度顺序表示排序的高低.
论文:DecisionFlow: Visual Analytics for High-Dimensional Temporal Event Sequence Data
作者:David Gotz and Harry Stavropoulos
发表会议:vast 2014
本文使用的数据是由一个美国医疗机构提供的,该数据记录了从客户被接收开始的所有事件,一共有32000个客户,8000种事件类型。每个事件都由三个要素组成,即事件类型、发生事件和发生主体(event type,time,entity),由一系列此类事件组成的数据就是题目中提到的时序事件数据( Temporal Event Sequence Data),而高维(High-Dimensional )指的是事件类型非常多。
本文主要的动机是由于之前的方法都不能处理维度(事件类型)超过20的此类数据,主要由于高维数据在可视表达上容易产生混乱,不便于用户观察、交互。因此,本文主要着眼于解决高维的问题,能对之前提到的医疗数据进行交互、有效的可视分析。
传统上,领域专家对此类医疗数据分析的目的是为了分析某个病症与哪些因素有关。他们的分析过程分为两步:首先,定义一些选择条件对病人进行筛选;然后,使用统计分析软件(SAS)对筛选结果进行分析。本文方法也遵循了这个流程,但是可视编码和交互的定义使得用户无需编程即可快速、高效地进行分析。