搜索结果 文章归档: 四月 2016

陈为教授出席云栖大会,助力天池大赛破解污染图谱

由阿里巴巴公益基金会、中国气象局公共气象服务中心主办,阿里云、浙江大学、中国天气网承办的天池数据可视化创新大赛宣布开赛。参赛者可对阿里云天池平台上的各类气象数据与公共环境数据进行分析挖掘,寻找空气、水质、企业排放、气象等数据之间的关系,并用可视化的形式展现出来。

中国的工业排放体系被认为是全世界最复杂的——既有全球最先进的宝钢,也有落后的中西部小钢铁。污染物和污染源本身已经构成了复杂的大数据体系,但要做到“精准治污”同时还要考虑气象数据的影响。

4月27日,陈为教授应邀出席云栖大会·南京峰会,现场展示气象、城市、电子商务等应用的数据可视分析案例,并参与启动阿里云天池数据可视化大赛。

继续阅读 =>

Task-Driven Comparison of Topic Models

在文本处理和数据挖掘领域有一种非常重要的方法,那就是主题模型方法。他能有效的从文本语义中提取主题信息。主题模型主要由词、文档和话题构成。其中文档是要处理的数据源,它由很多词构成。从文档中我们能抽取一些词的集合,最终构成一个个主题。凡是类似这种结构的模型(甚至不仅仅是文本模型),都可以使用主题模型方法。因此,这一种方法有其自身很强的普适性。在过去,尤其是在可视化领域,分析主题模型的工具往往是用来分析其有效性的,对于比较不同的主题模型来说,方法与工具是极其少见的。而这篇论文就是从主题模型的比较入手,通过多种可视化方法来更有效地对不同主题模型的结果进行比较。

对于比较主题模型的比较, 我们比较的不仅仅是方法,不同的方法,不同的主题个数选取,不同的参数,都能产生不同的结果,这些结果甚至可能差异巨大。因此,我们对主题模型的比较不仅仅应该比较不同方法,可能还需要比较不同的参数选取等。

这篇文章对于主题模型的比较,可以从三个方面入手:主题内容、主题相似性、主题时变。其中主题内容主要比较同一个文章不同方法得出的主题内容的差异。相似性比较主要是对使用不同方法导致的不同文章之间主题相似性差异做对比。而最后主题时变则是比较不同模型对于主题变化的影响。下面分别从这三个方面对论文的方法进行阐述。

图1 主题内容比较可视化方法

继续阅读 =>

Comparing Color and Leader Line Highlighting Strategies in Coordinated View Geovisualizations

这篇文章主要对比了地理信息可视化联动视图中两种高亮的方法,分别是颜色高亮和引导线高亮。最终,本文得出,在联动多视图的可视化系统中,引导线可以作为一种可选的高亮策略,这样一来,颜色可以保留下来用作其他的可视化编码。

1 Background

从题目来看,文中有两个关键词——“Highlighting Strategies”和“Coordinated View Geovisualizations”,首先来认识一下“Coordinated View Geovisualizations”。这里要引入一个概念即CMV,CMV是“coordinated multiple view”的缩写,联动多视图可视化系统利用两个或多个视图来展示不同的数据或者是相同数据的不同可视表达形式。文章中并没有明确的对“Coordinated View Geovisualizations”进行定义,但是通过对文章的整体阅读,我们可以简单的把它看作是包含地图视图的CMV系统。

在CMV系统中,需要能够将各个视图联系起来的高亮可视表达。高亮是一种短暂的视觉效果,它能够使得待观察对象更加的突出,用户利用它,对待观察对象尽快的进行识别和评估。常用的高亮法是颜色高亮,就是将待观察对象用一种特定的,饱和度和亮度比较高的颜色进行描边或者填充。除了这种方法之外,其实还有很多别的高亮的方法,比如说景深、引导线、透明度等等,但是目前而言,对这些方法的识别和比较的研究却非常的少。

CMV系统比起单一视图的可视化系统而言,对用户的感知和认知系统有一定的要求,因为它需要将多个视图联系起来,通过对多个视图的信息的整合,来完成特定的任务。所以,为了使得用户能够更加简单的阅读联动多视图可视化系统,高亮策略应当尽量的减少用户在阅读时的感知和认知负担。但是在一些系统中,将高亮色运用到大量的主题元素中,这个时候用户就很难分清哪些是高亮对象,哪些是主题元素。因此,对于这种情况而言,一个比较好的高亮策略是利用一种不需要颜色的可视化策略来高亮视图之间关联的元素。这样可以将颜色留出在其他的可视化编码。

在本篇文章中,作者利用视线追踪技术,对选取的一种不依赖于颜色的高亮策略——引导线和颜色高亮法的表现进行了实验对比(见图1)。其中,颜色高亮是联动多视图系统中最常用的方法,它主要是用特定的颜色对对象进行描边或者填充,而引导线则是从所选对象出发,用直线连接它和其他视图关联的对象。

图1

继续阅读 =>

学术论坛:城市数据可视化

4月26日上午9点,来自Fraunhofer Institute for Intelligent Analysis and Information systems (IAIS)的Andrienko夫妇到访CAD&CG国家重点实验室,并带来了题为“Space, Time and Visual Analytics” 的学术报告。

继续阅读 =>

学术论坛通知:Visual Analytics of Urban Data

“人脑网络可视化”——记时磊教授报告

4月12日上午10:30,来自中科院的时磊教授为CAD&CG国家重点实验室带来了题为“Visual Comparison of Human Brain Networks”的学术报告。

人类探究自身的求知欲永无止境。而随着技术的发展,非侵入方法采集人类脑部数据的成功,使得人类进一步搞清大脑的工作机理成为可能。利用MRI掌握脑灰质与脑白质的分布;利用DTI/DWI检测脑内部液体的流向,从而得出脑纤维的走向;使用Gyral Labels将人脑从高层分成68-70个区域……从而建立起人脑网络。然而,与传统的社交网络不同,人脑网络数据稠密,难以观测细节;同时不同人的人脑网络也十分相似,使得比较成为难题。

继续阅读 =>

[招聘]杭州网易 资深/高级数据可视化工程师(前端技术部)

职位描述:

1、开发数据可视化引擎及其相关工具和应用;

2、跟踪数据可视化领域的最新发展,调研相关技术,整理形成专业知识库;

3、积极推广数据可视化相关理念和方法;

继续阅读 =>