2018 十一月

Embedded Merge & Split Visual Adjustment of Data Grouping

作者：meihonghui 日期：2018 年 11 月 26 日没有评论

论文：Embedded Merge & Split Visual Adjustment of Data Grouping
发表：InfoVis’ 18
作者：Ali Sarvghad, Bahador Saket, Alex Endert, and Nadir Weibel
继续阅读 =>

Manifold: A Model-agnostic Framework for Interpretation and Diagnosis of Machine Learning Models

作者：lujunhua 日期：2018 年 11 月 13 日没有评论

作者: Jiawei Zhang, Yang Wang, Piero Molino, Lezhi Li, David S. Ebert. 1作与5作来自于Purdue University, 其余来自Uber公司.

发表: IEEE VIS 2018, VAST / TVCG

简介

近年来在机器学习领域上有了不少重大的突破, 很多场景应用中都有了巨大的进展. 但是这也带来了一些问题, 首先, 模型越发复杂, 让模型开发者很难解释为什么模型会起作用, 以及它们是如何运作的; 其次, 开发者没有可靠的证据或者推理来指引他们开发与调试, 这导致模型开发这样一个迭代过程十分耗时、容易出错.

可视化与交互界面在帮助用户将自己知识结合进解读和诊断模型的过程中去. 常见的解决方案包括, 通过可视化模型内部结构或者状态来增强用户理解与解释, 评估分析算法和模型的性能, 在模型开发不同环节加入交互成分(如超参调试, 特征工程过程中加入领域知识). 但这些模型的关注点都在某些特定模型类别上或者特定任务类型(如 classification). 这些工作缺乏可扩展性, 很难对付industry-level的使用场景, 因为这种场景下模型和任务的体积与复杂度都非常大.

本文提出框架Manifold来解决整合、评估和调试多个模型的问题. 这个框架的设计过程结合了机器学习诊断与比较时常用的三个阶段: 检视(假设), 解释(推理)和改良(校验). 为了支持这些阶段, Manifold提供了两个简洁而丰富的视图: 基于散点图的模型比较视图, 提供一个模型对(model pairs)丰富性与互补性的可视总结. 用户可以在这个视图上找到有问题的数据自己并提出假设. 第二个是一个表格形式的视图, 帮助用户区分从有问题的数据子集中抽出的不同特征, 哪些特征对模型输出有更大的影响, 并提出对于之前猜想的解释. 随后这些解释又可以被加如到下一轮迭代中去来验证和改良模型.

Manifold是model-agnostic的, 这个词的意思是无所谓你模型长什么样, 只要你有一样的任务, 一样的输入输出就可以了. Manifold不需要接触模型内部的logic.

继续阅读 =>

机器学习基础概念和统计机器学习基本算法

作者：houyuxuan 日期：2018 年 11 月 12 日没有评论

整理：侯宇轩

一、背景

机器学习（machine learning）形象的来说，就是使用机器（计算机）利用数据，自行对数据特征进行学习（与手工编写程序直接解决问题区分），来解决现实生活中的问题（如手写数字识别、实例分割等等）。

机器学习算法已经对人们对数据的利用方式造成了重大改变。例如医院开始将诊疗数据保存下来，包括病人的基本信息、医生的诊断结果、CT图像等等。使用学习型算法对这些数据进行分析，就可以得到一段时间内的病例发展趋势，或者尝试利用CT数据对病人的病灶进行自动检测等等。

继续阅读 =>

DQNViz: A Visual Analytics Approach to Understand Deep Q-Networks

作者：zhangtianye 日期：2018 年 11 月 12 日没有评论

作者：Junpeng Wang, Liang Gou, Han-Wei Shen, and Hao Yang

发表：VAST 2018 (honorable mention)

一、简介

Deep Q-Network (DQN)是Google DeepMind研发的用于解决强化学习问题的深度卷积神经网络，用于训练一个能自动玩Atari 2600游戏的代理。其目的让代理跟环境（游戏）进行交互，代理需要进行游戏内的操作，完成操作后，根据某种奖励机制，不同游戏状态会获得不同的奖励，DQN的最终目标是使整个训练过程的全部奖励之和达到最大。下图为不断循环的训练过程：

继续阅读 =>