在合适的地方做事情 (访美札记之二)

一大早看到一篇关于阿里云前CEO王坚的爆料文章,顿时冒了一声冷汗。王博士之前的光环一大片,但仅限于学术。自从投身互联网企业,烂评如潮啊。出身于杭大心理系,却做了一款漫游故宫的虚拟现实演示,一举成名,时间远远早于浙大CAD实验室拿下全国第一个虚拟现实973项目。后被北大董士海老师作为中国最牛的图形学人才(?)推荐到微软亚洲研究院。在微软时,也算成功,智能墨水赢得一片舆论。但MSRA是个靠做论文吸引眼球的地方,做的很多东西华而不实,而公司是只讲效益不讲道理的地方,所以做的不如意也正常。

 

由此,事业是否顺心,个人的求职定位非常重要。适合做论文、搞新想法的,就在高校里呆着;喜欢实干、码代码的,就去公司;能做原型系统、又能偶尔发发高等级论文的,选择大公司的研究机构;擅长沟通、心理素质强的,考虑去政府部门。如果硬拉郎配,选择自己不喜欢的地方,可是要到大霉的。

 

这次在美国逛了不少地方,正反的例子都见到。只讲两个正面的例子吧。

 

教授M,博士毕业后领导美国最大的可视化团队,学术组织担任各种组织,还获得业内大奖。凭借他与合作单位的影响,各位应该觉得他有不少产品吧?NO。到目前为止他一个软件注册、一个专利也没有。前段时间有硅谷公司找他创业,他也一口回绝。他的说法是,这一辈子做做研究,家庭幸福,到处有朋友,每年几十次国际旅游开会,很舒心。

 

博士R,毕业于美国CS排名第一的名校。该校由钢铁大王创立,初期是工程师的摇篮,中国桥梁大师茅以升是它的第一个毕业博士。该校培养学生的宗旨是,研究和工程能力兼备。R博士毕业后,精心选择了一个企业研究院,以其精细神准的做事风格,迅速立足,短短两年内连升3级,近期传闻快要升到公司VP级别。与他同期毕业去美国高校任教的同学,有些从高校退出,有些则因为研究方向不景气还需要从他手中获得资金资助。

 

VIS2013中和Tamara Munzner的对话

(编者按:本组学生summer酱有幸赴美参加VIS2013会议,以下是她在会上与可视化领域著名学者Tamara Munzner的交流记录,经summer本人同意后发于本博客,与各位同仁共勉。)

今天有幸能在茶歇的时候和UBC的大佬Tamara Munzner交流,我把问题整理了一下和大家共享,顺便表达一下我对她的仰慕之情。

其实我们问的问题跟她的回答和后面的panel内容还比较相关的,关于design practice,因为对话是从我读了她那本书开始的。

Q1:如何开始一个problem-driven的project工作?

她提到可以关注一下她去年的那篇methodology的paper (Design Study Methodology: Reflections from the Trenches and the Stacks)。但是作为一个problem-driven的项目,设计或者实现工作真正开始之前的第一步一定是明确领域/问题的真正需求,这就要和领域专家反复的沟通,因为领域专家和设计师看问题的角度不同(they speak different languages)。比如领域专家讲了一大堆问题的背景、需求、想要达到什么效果,设计师听到的可能只有其中的一些关键词如“过滤”、“分类”、“聚合”,而可能设计师所听到的“过滤”并不是他们所理解的那个过滤(filter)。就像我们说一个问题的方法可以迁移(transfer)到另一个问题上,机器学习领域的同学迅速抓住了transfer这个关键词,开始yy这跟迁移学习有什么关系,但其实没什么关系一样。因此和领域专家的交流和沟通一定是反复的、增量式的。

继续阅读 =>

苍南支教札记

2013年10月28号至11月9号我在浙江省温州市苍南县的双灵小学进行支教,同行的还有CAD实验室的另一位同学。

双灵小学地处较偏,学校的四周都是稻田,我们要坐公交车往返学校和住宿之间。学校一共160个人左右,全部教职工一共11人。学校去年才有专业的英语老师任教,之前英语教学一直是其他的老师进行代课。大部分的学生来自邻近的两个村子,有部分是住在当地的外来打工者的小孩。家比较远的孩子中午会在学校里面吃饭,学校的所有老师和我们两位支教的中午也一起在学校吃饭。

每天早上在学生们朗朗的读书声中步入学校,校门口值班的学生总能朝气蓬勃地向我们问“老师好”,新的一天开始了。每次走在校园里,听到认识或者不认识的学生热情地向我问好,总会异常开心,也会突然觉得教师这个职业的确很光荣。来这里了几天,感觉到了身为老师的骄傲,也逐渐感受到了老师的责任。学校的孩子都很活泼,脸上都挂着笑容,课间和课后大家会一起玩耍。

每天学校上下午各安排3节课,这样平均一个老师一天就有三四节课。通常一个老师要教两至三个年级的三到四门课,由于学校老师少,一旦哪个老师有事情请假,其他老师的课就会比较多。我们的支教的确起了很大的作用。我在学校支教两周的时间中,一到六年都教过,各个科目的课程也都教授过,包括语文、数学、英语、美术、思想品德、地方课程、科学课等。上语文课,给学生们讲解《仓颉造字》的课文,我从网上找了关于这个传说的视频以及汉字的演变的视频,这些视频带有动画性质,学生们比较感兴趣,学习的热情非常高。上六年级美术的时候,我从网上找了一些画家画的二义性的或者现实中不存在的、或者锻炼智力的图片让大家观看,发现也能立刻激起他们学习的兴趣。在课堂上我会尽量多进行提问,这样可以让学生更集中注意力。他们回答得比较好的时候,我会进行表扬,这样他们比较有信心;即使回答得不太好,我也会给予鼓励。孩子们的好奇心很强,课堂气氛都很活跃,尤其是看到我们这些去支教的老师会问东问西。第一天支教自己可能也没有多少经验,加上有四节课,学生们也都比较调皮,结束后特别累;但是觉得很充实,心里是满满的成就感。孩子们虽然很调皮,也很可爱,跟他们在一起会觉得自己也富有朝气,充满活力。

继续阅读 =>

计算机和医学双料博士 (访美札记之一)

2013年10月18日到2013年11月14日,我在美国游历了5所高校、1个研究院和硅谷,接受了一次美国教育和科研的洗礼。凭记忆写下一些小故事,供大家回味。

(一)计算机和医学双料博士

访问某大学时,与多年的好朋友M教授偶然聊到他的一个学生N。N的名字是我们组的小丁同学在课题背景调查时获悉的。小丁和我想在科学数据的可视化中找一块硬骨头去啃,我们认为大尺度科学数据的压缩是一个非常有意义的难题。N和M连续在可视化顶级会议IEEE SciVis上发表了两篇关于三维体数据压缩的论文,特别是第二篇论文实现了浮点型体数据的无损压缩,走在了世界研究前沿。两篇论文中的大篇幅内容是信号压缩方面的一些数学推导,普通人非常难以理解。我和小丁讨论后的结论是,N一定是一个专门做数据压缩的专家,和M在三维体数据压缩方面合作,完成这个神作之合。

M教授听到我对N的工作感兴趣,讲述了他的一段有趣的故事。N是一个美国学生,本科阶段加入M的小组,显露了他在科研方面的过人素质。N做事非常专一,完全凭个人兴趣行事,只要瞄准的事情,一定做到底,且拼尽手段达到目标。三维体数据压缩的题目,是M从NASA的科学家们那里获得的题目。N在没有任何专业背景的情形下,翻阅了图书馆所有有关数据压缩的书籍,单枪匹马提出并实现了两个高质量算法。其中关于浮点型体数据的无损压缩的论文,由于论文篇幅限制,省略了大段推导文字。

M教授笑眯眯地说,N的神奇之处不仅在于他在可视化研究方面非常出色,还在于他的离奇学历。N读博时认识了一个女友,是医科博士生。期间,N中断学业,跟随女友去了非洲一年,为难民提供医疗服务。回美国后,N郑重告诉M,他的理想是为全世界受苦难的人民提供更好的医疗服务,这个梦想的重要性远远超过做科学数据的可视化研究。于是,他决定去医学院读医科MD。说到做到,他立刻休学,加入了另外一所大学的医学院,苦学了若干年。可惜的是,女友和他分了手。

M觉得N的资质非同小可,如果放弃唾手可得的CS博士学位非常可惜。于是又劝说他回到学校,干了半年,圆满完成了博士论文,获得CS博士学位。目前,他已从医学院毕业,在华盛顿的一家著名医院做了住院医生,从此告别了计算机界。M认为,N的做事风格决定了他在临床方面也一定会获得成功。

HPC China 2013札记

10月底,为期三天的2013年全国高性能计算机学术年会(HPC China 2013)在广西桂林召开,我和实验室的另一位博士生朱标同学参加了会议。

 

作为可视化的领域的研究人员,我一直认为,不管是作为工具,还是供我们研究的对象,高性能计算能力都是我们日后研究必备的。换言之,在当前大数据云计算的口号覆盖之下,一方面需要高性能计算给我们分析数据提供充足的计算资源;另一方面高性能计算本身会产出大量的数据,对于视数据为生命的可视分析来说,这是绝佳的数据来源。因此,我参加会议的目的有二,一是看一下在高性能计算研究领域国内的研究思路,二是观察可视化在这之中的前景。

 

到达桂林,稍加休息,我们到达会场。由于事关高性能计算,而且是有一定影响力的全国性会议,国内相关科研院校都有参与,也吸引了一大批厂商参展,主会场外的布展还是透露了一定的商业气息。从会议日程上来看,上午是主会场的主题讲座,下午是各个分会场的活动。在主会场进行的专题讲座中,有两个主要讲座是可视分析的,时间也提供得比较充裕,主讲人分别是犹他的Chris Johnson教授和北大的袁晓茹老师。由于不知道前几年会议的日程,我无法推断可视化在HPC中的地位发展情况。

从演讲的内容上来看,Chris Johnson教授应该是用了2012年在北大做报告时用的PPT,可能是没有时间,他们灵巧的pad交互操作没有出现。Chris Johnson教授的报告内容集中在科学可视化一块,当然目前来说,这一块是和高性能计算联系最为紧密的,而且国内外各大院校在科学数据计算方面有着不小的需求,高性能计算在其中扎根已久,发展至今也催生出很多可视化的需求。袁晓茹老师的报告介绍了他们团队的一些成果,也花了很多笔墨在集合模拟数据可视化,空间多变量数据的可视化之上。在座的听众有各个超算所,企业院校的研究人员,有偏向研究底层计算的,也有在具体学科应用的,两个主讲人应该是考虑到了听众的知识结构,有目的性地选择了报告的内容。 继续阅读 =>

基于信息论的多变量数据探索框架构建方法

文章:An Information-Aware Framework for Exploring Multivariate Data Sets

来源:SciVis2013

作者:Ayan Biswas, Soumya Dutta, Han-Wei Shen, Jonathan Woodring

本文主要介绍了一种基于信息论的多变量数据可视分析框架构建方法,流程如图1所示

图1

继续阅读 =>

使用粒子动画对大规模并行计算中的通信模式进行可视化

论文:Visualizing Large-scale Parallel Communication Traces Using a Particle Animation Technique

作者:Carmen Sigovan, Chris W. Muelder, and Kwan-Liu Ma

会议:EuroVis 2013

 

并行计算在提升计算速度的同时,也会由于参与并行的各个节点之间的通信而带来额外的开销。这种开销通常会随着并行规模的增大而增加,而且它对于并行性能的影响也难以测量。此外,随着一些并行库(比如ScaLAPACK)的广泛应用,底层的MPI细节被隐藏,使得对于并行计算中通信行为的分析更为困难。

本文提出了一种基于粒子动画的技术,用于分析并行计算中的通信行为。目的在于帮助用户看分析这些通信行为的模式,从而使用户可以发现影响并行性能的问题并加以优化。本文提出的方法可以支持多达16,000个处理单元的并行规模。

可视设计

下图是本文可视化的主视图,即粒子动画部分。横轴对应了处理单元(processor),按rank从小到大一次排列,并进行分组,组的边界上标明了处理单元的编号。纵轴是时间,由于在MPI的通信时间的时间跨度很大,所以采用了对数的形式。每个粒子则对应了一个MPI消息事件,不同类型的事件用不同的颜色进行编码。每当一个事件出现,就会在对应的处理单元的位置出现一个点,然后随着时间的推移,这个点会往上运动,这样一来就形成了动画。当事件结束的时候,对应的点就会停在最终的位置,然后慢慢淡出。当然,本文并没有将淡出的点直接舍弃,而是以一定的透明度叠加成了一张背景纹理,作为对历史事件的概览。

继续阅读 =>

UTOPIAN:用户驱动的文本主题模型

论文:UTOPIAN: User-Driven Topic Modeling Based on Interactive Nonnegative Matrix Factorization

作者:Jaegul Choo, Changhyun Lee Chandan K. Reddy, and Haesun Park

Georgia Institute of Technology

会议:IEEE VAST2013

文本主题抽取是一个很重要的话题。何谓“主题”?从字面上理解是一段文字表达的中心思想。从统计模型的角度可以用关键词的分布来刻画。这样一段文字可以理解为是从一个概率模型中生成的。

Utopian可视界面。图中每个点代表一个文本,不同颜色编码了不同文本对应主题。用户基本操作包括了:1.将某两个主题合并,2.以某文本生成新主题,3。对某个主题进行分裂,4.以某关键词生成新主题

继续阅读 =>

多属性排行榜的可视分析

论文: 《LineUp: Visual Analysis of Multi-Attribute Rankings》

作者:  Samuel Gratzl, Alexander Lex, Nils Gehlenborg, Hanspeter Pfister and Marc Streit

会议:  InfoVis2013 [best paper]

排行榜在生活中很常见,对人们作决策也有一定影响。对于多属性排行榜,排名是如何计算得出的、各属性对排名的贡献多大、同一数据在不同排行榜的差异多大等等,这些大家很难从传统排行榜中直观感受到。本文提出一种可视分析方法,可以直观、交互地设计、分析、探索排行榜。

LineUp界面如下:

继续阅读 =>

工作流可视化的可视压缩新方法

论文:《Visual Compression of Workflow Visualizations with Automated Detection of Macro Motifs》

作者:Eamonn Maguire, Student Member, IEEE, Philippe Rocca-Serra, Susanna-Assunta Sansone, Jim Davies, and Min Chen, Member, IEEE

会议:Infovis2013

本文介绍了一种基于自动检测motif,并结合用户打分进行选择并生成macro,最终实现对工作流图的可视压缩。

本文工作的流程如下:

 

A:输入数据存入数据仓库

B:Motif提取算法,从数据中提取motif

C:生成motifs

D:对motifs进行打分,根据分数进行排序

E:通过交互选择motif生成macro

F:选出macro

G:为macro生成图形

H:用户为macro标注

I:将生成生成的macro插入到工作流图中。

 

继续阅读 =>

第 24 页,共 36 页« 最新...10...2223242526...30...最旧 »