一种用来检测分析异常代码调用栈的可视分析方法。

作者：handongming 日期：2019 年 5 月 29 日没有评论

A Visual Analytics Framework for the Detection of Anomalous Call Stack Trees in High Performance Computing Applications

IEEE VAST 2018 Honorable Mention Award

作者：Cong Xie[1], Wei Xu[2], Klaus Mueller[1]

[1] Computer Science at Stony Brook University

[2] Computational Science Initiative at Brookhaven National Laboratory

继续阅读 =>

Manifold: A Model-agnostic Framework for Interpretation and Diagnosis of Machine Learning Models

作者：lujunhua 日期：2018 年 11 月 13 日没有评论

作者: Jiawei Zhang, Yang Wang, Piero Molino, Lezhi Li, David S. Ebert. 1作与5作来自于Purdue University, 其余来自Uber公司.

发表: IEEE VIS 2018, VAST / TVCG

简介

近年来在机器学习领域上有了不少重大的突破, 很多场景应用中都有了巨大的进展. 但是这也带来了一些问题, 首先, 模型越发复杂, 让模型开发者很难解释为什么模型会起作用, 以及它们是如何运作的; 其次, 开发者没有可靠的证据或者推理来指引他们开发与调试, 这导致模型开发这样一个迭代过程十分耗时、容易出错.

可视化与交互界面在帮助用户将自己知识结合进解读和诊断模型的过程中去. 常见的解决方案包括, 通过可视化模型内部结构或者状态来增强用户理解与解释, 评估分析算法和模型的性能, 在模型开发不同环节加入交互成分(如超参调试, 特征工程过程中加入领域知识). 但这些模型的关注点都在某些特定模型类别上或者特定任务类型(如 classification). 这些工作缺乏可扩展性, 很难对付industry-level的使用场景, 因为这种场景下模型和任务的体积与复杂度都非常大.

本文提出框架Manifold来解决整合、评估和调试多个模型的问题. 这个框架的设计过程结合了机器学习诊断与比较时常用的三个阶段: 检视(假设), 解释(推理)和改良(校验). 为了支持这些阶段, Manifold提供了两个简洁而丰富的视图: 基于散点图的模型比较视图, 提供一个模型对(model pairs)丰富性与互补性的可视总结. 用户可以在这个视图上找到有问题的数据自己并提出假设. 第二个是一个表格形式的视图, 帮助用户区分从有问题的数据子集中抽出的不同特征, 哪些特征对模型输出有更大的影响, 并提出对于之前猜想的解释. 随后这些解释又可以被加如到下一轮迭代中去来验证和改良模型.

Manifold是model-agnostic的, 这个词的意思是无所谓你模型长什么样, 只要你有一样的任务, 一样的输入输出就可以了. Manifold不需要接触模型内部的logic.

继续阅读 =>

Uncertainty Visualization by Representative Sampling from Prediction Ensembles

作者：weiyating 日期：2018 年 7 月 9 日没有评论

作者：Le Liu, Alexander P. Boone, Ian T. Ruginski, Lace Padilla, Mary Hegarty, Sarah H. Creem-Regehr, William B. Thompson, Cem Yuksel, and Donald H. House

发表：2017 InfoVis

一、介绍
1. 背景
模拟模型已成为预测生成的主要工具，但这些模型的预测通常包含高度不确定性。这种不确定性可能有很多来源。当被建模的系统由非线性动力学控制时，而且敏感地依赖于初始和边界条件，这是不确定性就会不可避免的发生。其他不确定性来源包括对实际系统建模，参数估计和数值误差累积所做的假设和近似。
集合(Ensemble)是对可能由包含不确定性的模型产生的投影空间进行采样的关键工具之一。在天气预报中使用模型就是一个很好的例子。通常，一次或多次天气模型多次运行，每次运行的初始条件或参数略有不同。这就得到了基于模型的单个投影的集合，气象学家必须从中确定要向公众呈现的聚合预测。通常，这将包括预测的天气结果，以及预测的确定性或置信度的度量。
2. 挑战
虽然集合是进行预测的重要工具，但是它们很难用于创建有效的可视化。继续阅读 =>

Graph Layouts by t-SNE

作者：zhuminfeng 日期：2018 年 4 月 13 日没有评论

论文：Graph Layouts by t-SNE

作者：J. F. Kruiger, P. E. Rauber, R. M. Martins, A. Kerren, S. Kobourov, A. C. Telea

发表会议：Eurographics Conference on Visualization (EuroVis) 2017

介绍

图布局是信息可视化中一个重要的任务。然而，随着数据量的增加，传统的图布局方法生成一个“好”的图布局结构越来越困难。降维方法可以将一个高维向量映射为低维空间中的向量，这和图布局的目标是类似的。尽管基于降维的图布局似乎很简单，但是这方面却少有相关的工作。这片文章基于对t-SNE降维方法提出了一个新的图布局方法，tsNET（*）。tsNET（*）将原始的图的拓扑结构表达为一个距离矩阵，并且通过对t-SNE目标函数的少许修改，达到更好的图布局结果。

继续阅读 =>

解析可视化中的对比分析任务

作者：yuxin 日期：2017 年 12 月 22 日没有评论

论文：Considerations in Visualizing Comparison

会议：InfoVis 2017

作者：Michael Gleicher

“比较”或“对比”（comparison）是数据分析中最主要的任务之一，例如比较两张CT扫描结果，在不同车辆的行车轨迹中寻找差异，或是对比多次天气预报模型的预测结果等。当我们进行比较InfoVis 2017的这篇《Considerations in Visualizing Comparison》主要从视觉设计和交互角度出发，总结可视化中出现的对比分析形式和手段，来指导可视化系统的设计者如何设计面向比较任务的视图和交互。

继续阅读 =>

SOMFlow: Guided Exploratory Cluster Analysis with Self-Organizing Maps and Analytic Provenance

作者：guyuhui 日期：2017 年 10 月 18 日没有评论

论文：SOMFlow: Guided Exploratory Cluster Analysis with Self-Organizing Maps and Analytic Provenance

作者：Domink Sacha , Matthias Kraus , Jürgen Bernard

简介：本文提出了一个引导式探索性聚类分析工具SOMFlow，使用SOM算法分析时变数据。

动机

聚类方法可用于分析大型未知的时序数据集，但存在一些问题：1.分析的问题不明确；2.有趣的模式往往隐藏在特定子集中；3.难以从一堆聚类结果中发现联系；4.揭示目标结构需要适时调整底层计算。因此聚类分析中需要交互式的数据探索，来形成和提炼假设，调整底层计算。

继续阅读 =>

Finding Similar People to Guide Life Choices: Challenge, Design, and Evaluation

作者：lujunhua 日期：2017 年 6 月 3 日没有评论

文章标题: Finding Similar People to Guide Life Choices: Challenge, Design, and Evaluation

来源: CHI 2017, 获得Best Paper Honorable Mention (top 5%)的荣誉

作者: Fan Du, Catherine Plaisant, Neil Spring, Ben Shneiderman

作品网页: http://hcil.umd.edu/peerfinder/

一、基本问题与动机

人们往往会寻找相似个体来指引他们做出人生选择 (Life Choice), 比如说, 病人往往会接受这样的治疗: 这种治疗在别的和他身体条件差不多的、症状也类似的人身上起作用; 新学生希望遵循前面的人轨迹, 那些有着相似背景和学术表现的人, 最后能够有一个好的职业生涯. 若用传统工具去query会异常复杂, 还可能不返回结果, 毕竟每个人都是独特的个体, 有些属性不能完全的准确匹配. 作者们做的这个大的项目已经持续了十年多, 与诸如医疗研究者\医生\市场营销\交通分析等领域合作, 长期目标是支持prescriptive的用户界面; 而本文主要关注寻找相似个体的寻找过程.

本研究的贡献点在于:

提出了寻找相似个体来指引人生所面临的挑战
实现了一个灵活的原型系统, 它允许用户探索不同层次的控制和上下文、并优化寻找结果
原形系统不同界面配置、基于此的用户调研与访谈

继续阅读 =>

Sketching Designs Using the Five Design-Sheet Methodology

作者：meihonghui 日期：2017 年 5 月 12 日没有评论

论文：Sketching Designs Using the Five Design-Sheet Methodology

作者：Roberts J C, Headleand C, Ritsos P D.

简介：草图在设计不同方案时非常有用。低保真度的草稿可以节省时间，更快的获取更好的解决方案。这个过程常常太过随意，用户不知道如何管理思维和想法。本文提出了FdS(Five Design Sheet)方法学，指导用户如何通过低保真的草图规划和表达想法，得到最终的设计实现。

继续阅读 =>

利用嵌套平行坐标图进行多分辨率气象数据集合的参数分析

作者：lujunhua 日期：2017 年 5 月 1 日没有评论

利用嵌套平行坐标图进行多分辨率气象数据集合的参数分析

/ Multi-Resolution Climate Ensemble Parameter Analysis with Nested PCPs

会议: VAST2016/ Session Machine Learning

作者: Junpeng Wang, Xiaotong Liu, Han-Wei Shen and Guang Lin

系统截图如下

一、气象预测数据集及相关问题简介:

气象学中, 对流是降雨形成原因。给定一个大气状态和大气移动参数的值（对流参数），根据已有信息迭代地运行模拟来得到下一个时间段的状态。一般将感兴趣的空间区域离散化划分成一块块网格，在这些网格上迭代计算，计算下个时间段的状态，网格大小即是分辨率。为了提升准确率，会采用不同参数调节机制，这样就导致了多组参数；另在不同的分辨率下模拟可捕捉不同尺度下的特征，导致了多分辨率时空气象ensembles这样的数据集。

在相关领域研究中，这样的预测模型有一定的局限性：模型对于参数设定与分辨率都很敏感，高分辨率模型不一定总比低分辨率的好、而且计算开销不同，分辨率越精细开销越大。为此，领域专家需要分析一些问题，来应对这样的局限性。比如：不同参数之间的关联（correlation）；这样的关联在不同分辨率下是否可转移（transferable）；对流参数和时空模拟ensemble数据（输出）间的关系。

继续阅读 =>

Vega-Lite: A Grammar of Interactive Graphics

作者：gaoxiang 日期：2016 年 11 月 2 日没有评论

论文：Vega-Lite: A Grammar of Interactive Graphics

作者：Arvind Satyanarayan, Dominik Moritz, KanitWongsuphasawat, and Jeffrey Heer

发表：InfoVis 2016

在 InfoVis 2016 上，UW 交互数据实验室提出了一种新的交互数据可视化语法——Vega-Lite，获得了今年的 best paper，本文将根据其论文从多个角度介绍 Vega-Lite。论文地址

什么是 Vega-Lite？

简而言之，Vega-Lite 是一种数据可视化的高级语法，能够快速定义一些基本的交互式数据可视化。

如果你听说过 Vega，那么光看 Vega-Lite 的名字就不难想到它们的关系。Vega-Lite 就是编译成 Vega 的更高级图形语法。

如下图所示，只要右边寥寥数行代码，就能定义一个散点图：

继续阅读 =>

第 1 页，共 7 页12 3 4 5...»最旧 »