从不受待见到趋之若鹜(访美札记之五)

本篇借用了他人的一个题目。收藏界有一个有趣的现象:很多当代最受追捧的钱币(价格随之高企)在发行之时或发行之初都是不受待见的品种。这些币刚刚发行时,由于种种原因造成发行量低或返熔量大,结果几十年后反倒成全了它们,成为藏家趋之若鹜的品种。

做研究与其非常相似。科学研究与工程开发不是一锤子买卖,不是投机,是一项投资的长跑。大家知道,可视化一直被认为是图形学中的一部分,在中国只有早期热火了一段时间,其后沉寂了10余年。直到现在,中国大陆的可视化研究仍然非常初步和冷清,缺少一些高层次的key players,因此也就难以引起人们的重点关注。去美国访问的几个学校,碰到好几个教授,都说美国现在可视化开始火起来,10余所学校招数据可视化的新faculty,但是难以招到合格的人才。由此凸显长期不受重视所造成的稀缺性。中国的节奏总要比美国慢半拍。2013年12月5日,中国计算机学会的大数据专业委员会发布了大数据白皮书(http://www.csdn.net/article/2013-12-04/2817708#6874737-tsina-1-57304-3048ae643c93bac2c9a415075e9789bc),总算官方上认可了数据可视化的重要性。

可视化不受待见的原因有很多,其中一个就是宣传。Harry Shum在任微软亚洲研究院的时候,大力鼓吹SIGGRAPH,一时大陆掀起图形学热潮。现在,语音学专家洪小文(微软亚洲研究院院长)是怎么说的呢?

1. 可视化和早期的Cobra编程语言有类似之处。Cobra看起来很不成熟的样子,但在商务里面用得很广,因为领导都能看得懂。可视化也一样,专门给领导看的。数据中的关键东西做出可视化,给领导一讲,马上就懂了。

2. 那有人问,我们不是已经有各种报表了吗?大数据的可视化一定是互动的(Interactive)。如果是报表里的图,领导如果想看点儿别的东西,你说,那我回去准备一下。等你准备好再回来,决策的时机可能就没有了。互动的可视化系统,只要一点,新的图就马上生成了。

3. 可视化系统不能让工程师来做。让他们来做,又搞出个matlab一样的东西,领导又看不懂了。现在很多startup已经做出不少很不错的产品了。

   高手就是高手,把事情说得又清又明。有不少人说,IEEE TVCG的影响因子远小于ACM TOG,因而只是图形学的第二名期刊。现在,大家意识到一些与影响因子有关的原因,IEEE TVCG明年起将VIS会议的特刊从10月改到1月,这样做会显著提高影响因子。

我的感觉是,接下来10年是做数据可视化和可视分析的攻坚期。尽管大数据时代泡沫很多,但沙子里总有金子,埋头苦干,做好了前途一片光明。

 

 

使用扩充极值图检测标量场中的对称性

论文:Detecting Symmetry in Scalar Field Using Augmented Extremum Graph

会议:SciVis 2013

作者:Dilip Mathew Thomas and Vijay Natarajan, Member, IEEE

对称性在许多学科中具有重要的研究价值,对数据中隐藏的对称性进行可视化能够帮助科学家更深入地观察理解实验结果。目前,检测几何体的对称性方法已经有深入的研究,但是标量场中对称性检测的技术仍不够成熟。本文将geometry信息扩充进extremum graph中,使用augmented extremum graph进行标量场中对称性的检测,相比于之前的方法更加高效,能够检测各种刚体变换下的对称性,同时在有显著噪声的干扰下也能有较好的表现。

本文使用了Morse Decomposition对标量场进行分割,其中标量场中每个极大值定义一个分割——即在该极大值点终止的所有梯度最大路径的集合,叫做Morse Cell。通过Morse Decomposition可以构建出extremum graph,如下图所示。相邻的cell通过shared saddle连接。

基于划分的回归模型构建验证框架

论文: A Partition-Based Framework for Building and Validating Regression Models

会议:VAST 2013

作者:Thomas Muhlbacher, Harald Piringer (VRVis Research Center)

回归问题是统计分析领域的永恒话题之一。统计学习领域有相当多的研究成果用于对回归模型进行拓展和改进,然而当前纯自动算法仍然存在以下问题尚待解决:

  • 特征子集选择:如何选择具有特征的维度,以及维度个数与模型可解释性、模型复杂度之间的权衡;
  • 将Domain Knowledge融入特征子集选择过程中:用户通常在维度选择上有一些先验知识,这些知识怎样输入到模型训练中;
  • 特征尺度变换:如何选择合适的变换尺度

本文通过构建一个可视分析框架,很好地弥补了上述问题。本文贡献如下:

  • 基于特征辅助模型预测程度的排序方法
  • 用于展示单一维度/维度对上数据局部结构的可视化视图
  • 验证和比较模型的工作流框架
  • 长时间的用户测试

继续阅读 =>

用于稀疏纤维结构可视化的轻量的基于实物的3D交互

论文: A Lightweight Tangible 3D Interface for InteractiveVisualization of  Thin Fiber Structures

会议: SciVis 2013

作者: Bret Jackson, Tung Yuen lau, David Schroeder, Kimani C.Toussaint and Daniel F.Keefe

本文为了针对稀疏的纤维结构的体绘制结果,能够更好地观察到数据内部的分布情况,定向信息,提出了一种轻便的、基于实物道具的3D的交互手段。本文需要一个深度感应的相机设备和低成本的3D显示设备来实现本文的交互。本文的主要任务是可以帮助相关领域的专家更好地理解三维的纤维结构体内部的方向信息,来判断其衍化出来的各类信息。系统的设计和评论都与两名医学专家进行了合作。与在医学领域的传统交互相对比,本文的新可视化系统提供了一个钟更加有效的方法来检查和理解他们收集到的3D医学数据。 继续阅读 =>

从来只有老师请学生 (访美札记之四)

D是我今年暑假才认识的一个朋友。他和我的研究领域不相关,暑假来浙大访问,和我们学院的另一个课题组合作。期间偶然拜访了我们实验室,并在小组内做了一次演讲,一见如故。我推荐他在不同地方做了另外三场演讲。D住在我们小区一个月,每天早上在小区内跑步,穿了一件有很多很大的破洞的圆领衫,1.80的细长个子,在做早操散步的大妈面前像一只大鸟飞过,很是吸引眼球。

我们到达美国的第一站就是回访D所在的学校N,正好赶上10月19日的一场橄榄球比赛。D的学校我之前从未听说过,到了后听D的详细介绍才有所了解。这所学校位于美国中部,创立于19世纪中叶,是全美非常有名的天主教立校的保守学校,校内有一所漂亮的天主教堂。学校属于小而精的传统美国名校,本科教育蜚声全美。由于宗教、传统和橄榄球队的影响,校友归宿感极强,校友网络遍布全国,每任美国总统都要来学校参加一次毕业典礼。学校管理的基金达90亿美元,相当有钱和人性化:本校职工去世,帮助安排其家属就业;本校职工的小孩读私立大学,学校会赞助一半的学费。

D的家族史可谓是中国近代史的一个缩影。他是广东人,上几辈一直遵循一种广东人出国的传统:父亲在美国打工,成年后娶妻生子将家庭留在广东生活,等后代长大后再带到美国工作。他父亲1950年代返回广东,死于文革。1978年他考上W大学,两年后被在美国的舅舅接到旧金山读大学,1992年毕业于普度大学。读博期间认识了现在的太太,来自东北的H教授。H教授性格大方,善于交际,从事的研究方向和D不一样,但都是计算机学科。学校为了留住D,把夫妻两人招到一个系,两人办公室在隔壁。H教授善结人缘,当过学校的副校长。D性格则相反,个性清高,研究之余,痴迷于中国古代文学,喜欢作诗吟词,静思长想。

D善于总结和思考,喜欢用隐喻描述事物,描述概念、讲道理通俗易懂。尽管H在外呼风唤雨,在内却全然听命于D。他们的两个双胞龙凤胎,许是因为结合了两人的优点,分别考上了哈佛大学和麻省理工学院。全家可谓是功德圆满。

D非常健谈。看橄榄球的那日,他的一个在外州做教授的学生专程坐飞机回来和我们一起看球。D包吃包住。在餐厅吃完晚饭,D一定要付帐,慷慨激昂地说了一句:做了教授,工资每年有20多万,花都花不完。和学生吃饭,从来只有老师请学生,这样才有老师的样子。我觉得这是他说的话中最有趣的一句。

大学学费和经费 (访美札记之三)

几年前听说美国大学学费很贵,斯坦福大学的图形学教授Marc Levoy抱怨他的儿子读不起斯坦福的本科,觉得蛮奇怪的。这次访问了2所全美相当有名的私立大学以及4所公立大学,听其中的一个教授C说起,才知道美国私立大学确实要价不菲。大学四年读下来,学费、生活费加起来要20多万美元了。C教授说,他们学校比较仁慈,本校职工的小孩考上私立大学,学费的一半由学校承担,因此他的两个上哈佛、MIT的双胞胎读书的压力就不太大。中国大学的学费相对来说不高,类似于美国的公立大学。但美国的公立大学整体上的本科教学质量远远不如私立学校,因此美国的学区房也是炒的火热(例如,硅谷的学区房是中部的4倍)。中国目前没有好的私立高校,质量最好的高校仍然靠国家拨款。最近中国提出的高校去行政化可能是高校体系改革的前奏。

到了研究生阶段,除了少量自费的学生,大部分学生(特别是中国、亚洲等地)都需要申请学校的助教(教务处)或助研(导师的经费资助),在导师的课题组从事研究活动。美国读博士需要交学费,大概一年4-5万美元,由导师的经费出。导师经费再出生活费一个月1500-1800美元(中期考核前后有区别)左右,相当于美国普通店员的收入。因此,美国科研经费里70%是人工费。CS博士毕业起薪8万左右。

与之相反,中国读博士不需要交学费。浙大规定博士学生中期考核后3500-4300每月(其中导师出一半,必须是人工费),相当于中国普通群众的收入。但是,中国科研经费里10%-15%是人工费。CS博士毕业起薪8万左右。

具体到IT行业,中美两国目前都很景气,工业界对学生的吸引力很大。计算机学科的学生真正愿意读博士的大体有两类:真正有兴趣做科研的(美国牛校中最顶尖的还是美国人,因为他们是为了兴趣而读博)、或者为了赴美/读博而读书(美国一些中部学校50%的研究生都来自亚洲;浙大很多博士生来自非211高校)而必须读博的。

现在,在各个国家的各个高校,招合适的博士生进入科研队伍,是计算机学科的导师的头等大事。

信息产品的用户体验设计

1. 为什么用户体验如此重要

在问及“在什么情况下你会选择卸载一个软件/系统”,答案无非三种:

  • 这个软件/系统给不了我想要的
  • 这个软件/系统有我想要的,可是我拿不到
  • 这个软件/系统有我想要的,我拿得到,可是这个过程太痛苦了

可以看出,后两个原因与用户体验息息相关。可是,一些不注重用户体验的开发者将百分之九十的精力放在了用户三分之一的关注点上。可想而知,如此设计出的产品或多或少都会有可用性缺陷。尤其是在“用户”扮演了重要角色的可视化系统中。

2. 什么是用户体验设计

创建吸引人的,高效的用户体验的方法叫做以用户为中心的设计(User-Experience Design)。它要求设计系统的每个步骤中,都要把用户列入考虑范围;在以用户为中心的系统设计中,开发者应该将思路从传统的“这个系统用来做什么”转变成为“这个系统要如何工作”。

继续阅读 =>

纽约市出租车数据可视化研究

Visual Exploration of Big Spatio-Temporal Urban Data:A Study of New York City Taxi Trips

作者:Nivan Ferreira, Jorge Poco, Huy T. Vo, Juliana Freire, and Cl ´ audio T. Silva

来源:VAST2013

本文主要对纽约市的出租车数据进行可视化,支持用户可视查询。系统主界面如下:

继续阅读 =>

在合适的地方做事情 (访美札记之二)

一大早看到一篇关于阿里云前CEO王坚的爆料文章,顿时冒了一声冷汗。王博士之前的光环一大片,但仅限于学术。自从投身互联网企业,烂评如潮啊。出身于杭大心理系,却做了一款漫游故宫的虚拟现实演示,一举成名,时间远远早于浙大CAD实验室拿下全国第一个虚拟现实973项目。后被北大董士海老师作为中国最牛的图形学人才(?)推荐到微软亚洲研究院。在微软时,也算成功,智能墨水赢得一片舆论。但MSRA是个靠做论文吸引眼球的地方,做的很多东西华而不实,而公司是只讲效益不讲道理的地方,所以做的不如意也正常。

 

由此,事业是否顺心,个人的求职定位非常重要。适合做论文、搞新想法的,就在高校里呆着;喜欢实干、码代码的,就去公司;能做原型系统、又能偶尔发发高等级论文的,选择大公司的研究机构;擅长沟通、心理素质强的,考虑去政府部门。如果硬拉郎配,选择自己不喜欢的地方,可是要到大霉的。

 

这次在美国逛了不少地方,正反的例子都见到。只讲两个正面的例子吧。

 

教授M,博士毕业后领导美国最大的可视化团队,学术组织担任各种组织,还获得业内大奖。凭借他与合作单位的影响,各位应该觉得他有不少产品吧?NO。到目前为止他一个软件注册、一个专利也没有。前段时间有硅谷公司找他创业,他也一口回绝。他的说法是,这一辈子做做研究,家庭幸福,到处有朋友,每年几十次国际旅游开会,很舒心。

 

博士R,毕业于美国CS排名第一的名校。该校由钢铁大王创立,初期是工程师的摇篮,中国桥梁大师茅以升是它的第一个毕业博士。该校培养学生的宗旨是,研究和工程能力兼备。R博士毕业后,精心选择了一个企业研究院,以其精细神准的做事风格,迅速立足,短短两年内连升3级,近期传闻快要升到公司VP级别。与他同期毕业去美国高校任教的同学,有些从高校退出,有些则因为研究方向不景气还需要从他手中获得资金资助。

 

VIS2013中和Tamara Munzner的对话

(编者按:本组学生summer酱有幸赴美参加VIS2013会议,以下是她在会上与可视化领域著名学者Tamara Munzner的交流记录,经summer本人同意后发于本博客,与各位同仁共勉。)

今天有幸能在茶歇的时候和UBC的大佬Tamara Munzner交流,我把问题整理了一下和大家共享,顺便表达一下我对她的仰慕之情。

其实我们问的问题跟她的回答和后面的panel内容还比较相关的,关于design practice,因为对话是从我读了她那本书开始的。

Q1:如何开始一个problem-driven的project工作?

她提到可以关注一下她去年的那篇methodology的paper (Design Study Methodology: Reflections from the Trenches and the Stacks)。但是作为一个problem-driven的项目,设计或者实现工作真正开始之前的第一步一定是明确领域/问题的真正需求,这就要和领域专家反复的沟通,因为领域专家和设计师看问题的角度不同(they speak different languages)。比如领域专家讲了一大堆问题的背景、需求、想要达到什么效果,设计师听到的可能只有其中的一些关键词如“过滤”、“分类”、“聚合”,而可能设计师所听到的“过滤”并不是他们所理解的那个过滤(filter)。就像我们说一个问题的方法可以迁移(transfer)到另一个问题上,机器学习领域的同学迅速抓住了transfer这个关键词,开始yy这跟迁移学习有什么关系,但其实没什么关系一样。因此和领域专家的交流和沟通一定是反复的、增量式的。

继续阅读 =>

第 20 页,共 32 页« 最新...10...1819202122...30...最旧 »