搜索结果 分类目录: 论文评述

Dendrogramix: a Hybrid Tree-Matrix Visualization Technique to Support Interactive Exploration of Dendrograms

Dendrogramix: a Hybrid Tree-Matrix Visualization Technique to Support Interactive Exploration of Dendrograms


Renaud Blanch, Rémy Dautriche, Gilles Bisson
PacificVis 2015

层次聚类是一种常用的算法,其将原始数据组织成树状结构,以刻画数据点之间的相似程度。经典的层次聚类可视化方式为系统树图(Dendrogram),本文则介绍了一种新的层次聚类树的可视化方法Dendrogramix,其混合了树和矩阵可视化方法,在聚类层次上叠加了个体关系的表达,丰富了表达的内容。

 

Dendrogramix的形成过程非常简单直观。如图一所示,将一个简单的包含有5个二维点的数据集(图一(a))层次聚类,其结果的系统树图如图一(b)所示。而Dendrogramix首先用矩阵编码了这五个点之间两两相似性(图二(a)),运用自动优化方法重排序按相似度显现出对角线上的聚类性质(图二(b)),将这些聚类加以编码(图二(c)),最后对折以节省显示空间(图二(d))。

继续阅读 =>

面向可视分析的轨迹简化和语义增强方法

SimpliFly: A Methodology for Simplification and Thematic Enhancement of Trajectories

Katerina Vrotsou, Halldor Janetzko, …, Natalia Andrienko, and Gennady Andienko

1、论文的出发点和主要贡献
轨迹描述的是运动物体,通常包含三类特征数据:(1)运动相关属性(速度、加速度、转向角…);(2)运动物体属性(车、船、人、动物…);(3)运动环境属性(天气)。因此作为多变量数据的轨迹,信息负荷很大,直接可视化会导致三方面问题:
(1)感知的局限性
微小的图元或变化肉眼难以分辨
(2)认知局限性
用户很难记住所有的信息,而实际上他们只关注于特定的信息
(3)性能
过多的点和线会妨碍交互
因此,对于轨迹数据适当的简化将给可视分析带来很大的好处。 继续阅读 =>

Visual Multiplexing —— 视觉多通

Visual Multiplexing

M. Chen, S. Walton, K. Berger, J. Thiyagalingam, B. Duffy, H. Fang, C. Holloway, and A. E. Trefethen

Eurovis 2014

 

论文中对视觉多通的理解为可正确解码的多可视信息的堆叠方式(“overlaying multiple pieces of visual information while allowing users to recover occluded information”),也就是说把不同视觉通道(颜色、大小、形状等)通过合理的组合方式编码在一起,使得用户能够正确的解码出可视元素所蕴含的信息。这篇论文提出了视觉多通的理论框架并把组合方式分为10类。

下图是视觉多通的流程图,左边将某个数据点需要可视表达的的多个信息量记为<x1, x2, …, xk>,该数据点通过k个可视映射方法被映射到显示空间的位置p的空间邻域D和时间邻域T,映射结果为<C1, C2, …, Ck>(MUX视觉多路复用过程),用户眼睛观察形成的映射结果,解码信息(视觉多路分离过程)。需要注意的是一个数据点不一定被映射到显示空间中的一个点,它有可能是由位置p周围几个视觉元素组成(空间邻域D)或是一个动态过程组成(时间邻域T)。另外,这个视觉多通的流程对应了信息可视化基本流程中从数据–>可视映射–>用户感知的过程。

继续阅读 =>

BERTIFIER: 一种新的表格数据的交互探索方法

论文:Revisiting Bertin Matrices: New Interactions for Crafting Tabular Visualizations
作者:Charles Perin, Pierre Dragicevic, and Jean-Daniel Fekete, Member, IEEE

发表会议:InfoVis 2014

表格数据在日常生活中很常见,对表格数据的处理、探索工具也非常多,但作者调查发现已有的系统还是有很大的改进空间,如下为作者对已有系统的调查,行代表系统,列代表特性,其中最后一行为本文系统,可见本文系统在很多特性上都得分很高。

本文是基于Jacques Bertin 提出的操作表格数据的思想:1)对cell进行编码;2)重排或聚类行和列,揭示模式。探索表格数据的很多研究也都是基于该思想的。

继续阅读 =>

Attribute Signatures:基于多累地理数据的动态可视化方法

论文:Attribute Signatures:Dynamic Visual Summaries for Analyzing Multivariate Geographical Data
作者:Author:Cagatay Turkay, Aidan Slingsby,Helwig Hauser,  Jo Wood, IEEE, Jason Dykes
发表会议:VAST2014 INFOVIS

一、论文概述

1 基础知识:

地理信息数据:受地理与地形信息影响(如:受海岸线、河流、道路等影响)、受不同政治区域影响、受不同经济活动影响。•分布于欧式空间上,具有边、界、方向,因变量是地理信息,自变量是相关属性(如人口密度等)。本文对地理数据的分析主要分为三个方向:
           位置(Location):地理上的测量点
           范围(Scale extent (or domain)):我们所关注的一片测量区域
           分辨率(Scale resolution):在一片区域内所能表达的细节总量

2 相关工作

地理位置相关的多元属性可视化难点主要是由于受屏幕空间和地图大小限制,我们同时一次只能展示少量属性,而由于地理数据可视化普遍要求保留地图信息,而地图信息往往已经占用了位置和尺寸信息两个可视通道。因此,这就造成了可视通道资源的进一步短缺。传统方法的地理数据可视化方法主要有:等值线图、热度图、配色方案等。但是这些方法同时间表现的信息过少同时,在表现这些信息的过程中还会对地图信息造成了遮挡。基于这些方法,后人对其进行了改进主要有:增加交互手段,如:过滤地图或属性信息或用特殊方式表现信息、强调绘制通道、并列与叠加(画刷选取),维度缩减,如:PCA、其它统计学模型等。

用可视推理方法评估城市道路交通状况

用可视推理方法评估城市道路交通状况

Fei Wang, Wei Chen, Feiran Wu, Ye Zhao, Han Hong, Tianyu Gu, Long Wang, Ronghua Liang and Hujun Bao, A Visual Reasoning Approach for Data-driven Transport Assessment on Urban Roads. IEEE VAST 2014. Email: wolflyecn@gmail.com

城市建设过程中道路评估是非常重要的,很多道路由于设置年代久远已经无法满足现代交通需求。传统的评估方法较为费时费力,需要专业的设备采集数据,即使有了数据也需要专业人员试验多种模型检验结果。城市出租车轨迹数据记录了车辆在道路上的行驶过程,由于其数据真实可靠而且覆盖了城市大部分道路,因此在城市规划、交通管理等领域都有广泛应用。例如,根据人类移动模式和POI发现城市不同功能区域,利用历史出租车轨迹预测车辆的行驶路径等。

将出租车数据直接应用于道路评估较为困难。首先,道路评估需要分析特定街道上的数据,分析师可能会任意选择街道和查询时间。其次,道路评估过程应该是交互式的,如何快速从大量的轨迹数据中得到需要的结果具有较大的挑战。针对上述两点,我们实现了一个可视化分析框架帮助分析师评估城市道路中各种现象和可能存在的问题。我们首先提出了一种基于道路的查询模型,该模型以道路和时间段为约束范围,查询该范围内具有特定语义的轨迹。我们将地图划分为均匀网格,相邻的几个网格单元相互连接形成道路的近似表示。如图1所示,直线之间为道路。

图 1 道路网格结构

继续阅读 =>

Visual Abstraction and Exploration of Multi-class Scatterplots

中文题目:多类散点图的可视简化与探索
作者:陈海东,陈为,梅鸿辉,刘致奇,周昆,陈伟锋,顾文涛,马匡六
发表会议:VAST2014

散点图(scatterplot)是一种使用非常广泛的可视化技术,常用于聚类分析、离群点分析、相关性分析等。多类散点图(multi-class scatterplot)作为散点图的一种扩展,其常用于比较分析应用。然而,随着数据规模的增大,有限的屏幕空间所造成的散点覆叠(overdraw)问题极大地限制了用户对可视化结果的正确感知。此外,不同的散点绘制顺序也会造成可视化结果的不一致性。如图1所示,不同的散点绘制顺序致使同一散点数据呈现出不同的可视化结果。

 

图1 不同散点绘制顺序对可视化结果的影响

    为了克服散点覆叠问题,可视化研究者们提出了一系列方法。改变散点的可视属性(如大小、透明度)是一种非常直观和简单的做法。然而,当散点的可视属性编码了其它信息时,该类方法易造成错误的理解。密度估计(density estimation)是另外一种可用于解决大规模散点数据的可视化方法。该方法易忽略低密度区域中的数据点。当应用到多类散点数据时,该方法还涉及多变量数据场的混合。这本身就是一大可视化难点。另外一类解决散点覆叠的方法称之为空间重分布(spatial redistribution)。其核心思想是将相互覆盖的点移至空白屏幕区域。这类方法本质上改变了数据的内在分布,可视化结果必然存在偏差。交互技术,如缩放(zooming)、焦点上下文(focus+context)亦可用于规避覆叠散点数据的探索。
本文提出了一种基于多类蓝噪声采样的方法实现多类散点数据的可视简化。为了增强简化结果的感知,本文还提出了一个散点颜色优化模型和一些散点形状设计方案。 继续阅读 =>

ConTour: 医药探索中多关联数据的数据驱动探究系统

论文:ConTour: Data-Driven Exploration of Multi-Relational Datasets for Drug Discovery
作者:Christian Partl, Alexander Lex, Marc Streit, Hendrik Strobelt, Anne-Mai Wassermann, Hanspeter Pfister and Dieter Schmalstieg

发表会议:VAST 2014

在现有的医药、化学领域探究多种关联性信息的研究中,由于数据尺度、关联性复杂等问题,快速探究多关联性很有难度,本文设计了名为ConTour的针对探索复杂、多关联性数据的交互性可视分析技术。用于探究在药物探索中,对药物潜在有效性和安全性的研究工作。

系统在功能上是对个体项目进行一系列属性关系的重排序;利用列嵌套、筛选等交互在表现具有父子关系的关联信息的交互,通过关系视图表达列与列之间的关联性的强弱、数据丰富的属性;通过细节视图同时表达多个数据集之间的多个个体的关联关系。

本文的相关工作分为三个部分:

1.Graph Exploration:Jigsaw、GraphTail

2.Faceted Browsing:InfoZoom、FOCUS

3.Pharmacology visualization: 相关的医药研究领域的可视化工具

本文的系统设计基于医学上的Biological Fingerprints(基因指纹)的概念,用来记录能够作用在细胞或者有机体上的分子和反应过程。设计的目标需求由相关专业领域的专家们提出:1.系统可以表现药物的反应机制;2.系统可以表现药物机制的生物反应流程;3.系统能够观察到在特定的治疗方案中新药品的潜在效用。

系统的数据是医药公司提供的大规模尺度的Pathways数据,从中我们可以提炼出相关的Gene,Compunds,Fingerprints,Therapeutic Groups数据集,用于探究其中的关联信息。

继续阅读 =>

Domino:多表数据集子集的抽出, 比较和操作

论文: Domino-Extracting,Comparing,and Manipulating Subsets across Multiple Tabular Datasets

作者: Samuel Gratzl, Nils Gehlenborg, Alexander Lex, Hanspeter Pfister and Marc Streit

发表会议:VAST2014 INFOVIS

导引:

介绍一种名为Domino的表数据的多形式可视化技术, 用于表示数据集的子集以及子集间的关系. 该技术给使用者提供了一套对子集进行排列组合和抽出的综合工具, 可以让用户实现常见的普通可视化形式以及针对特殊案例的高级可视化形式.

Domino最核心的两个组成部分是块(blocks)和块关系(block relationship).

详解:

1.块有如下三种分类型, 数值型, 矩阵型. 分类型诸如性别分类:男 女两种. 数值型如 不同歌手唱片数量, 一个小矩形代表一个歌手. 矩阵型中, 两个item type可以一样可以不一样: 如果两个都是同样的城市名称, 那么就可以用此来表示距离矩阵;  不一样可以表示如不同病人的癌症基因表达. 排序: 数值型中是根据数据的值; 分类型中是根据不同group分类被赋予的值,group内部无序的; 是根据两个维度items均值来, 按亮度顺序表示排序的高低.

继续阅读 =>

DecisionFlow:高维时序事件数据的可视分析

论文:DecisionFlow: Visual Analytics for High-Dimensional Temporal Event Sequence Data
作者:David Gotz and Harry Stavropoulos
发表会议:vast 2014

本文使用的数据是由一个美国医疗机构提供的,该数据记录了从客户被接收开始的所有事件,一共有32000个客户,8000种事件类型。每个事件都由三个要素组成,即事件类型、发生事件和发生主体(event type,time,entity),由一系列此类事件组成的数据就是题目中提到的时序事件数据( Temporal Event Sequence Data),而高维(High-Dimensional )指的是事件类型非常多。

本文主要的动机是由于之前的方法都不能处理维度(事件类型)超过20的此类数据,主要由于高维数据在可视表达上容易产生混乱,不便于用户观察、交互。因此,本文主要着眼于解决高维的问题,能对之前提到的医疗数据进行交互、有效的可视分析。

传统上,领域专家对此类医疗数据分析的目的是为了分析某个病症与哪些因素有关。他们的分析过程分为两步:首先,定义一些选择条件对病人进行筛选;然后,使用统计分析软件(SAS)对筛选结果进行分析。本文方法也遵循了这个流程,但是可视编码和交互的定义使得用户无需编程即可快速、高效地进行分析。

继续阅读 =>

第 4 页,共 7 页« 最新...23456...最旧 »