时序统计模型的可视交互选择

Visual Analytics for Model Selection in Time Series Analysis

作者:Markus Bögl, Wolfgang Aigner, Peter Filzmoser, Tim Lammarsch, Silvia Miksch, and Alexander Rind

来源:VAST2013

 

本文提出了一套可视分析系统,用以确定ARIMA模型适当参数。
ARIMA模型是统计领域用以对时序数据建模的常用工具,发展至今也有了一套完整的建模方法,如怎样进行模型识别,怎样进行模型的检验等。在实际应用领域,该模型也发挥着很大的作用,如计量金融,生物统计等等。
对于这样一套完备的理论,本文将整个流程进行了整合,将所有统计图表集中到一个系统中,当调整模型的参数时,系统可以对调整实时响应,绘制出统计图表,使统计学家能够看到模型的变迁,对模型进行实时地评估,提升建模效率。
本文采用了Box-Jenkins提出的建模流程,并设计了如图一所示的交互。
图一
系统界面如图二所示,值得注意的是,系统用的图表都是统计领域已有的做法,并没有做更进一步的改进。当然阅读这样的图表需要经过统计方面的训练,可能是考虑到该系统面向的用户群是统计专家,这样集成的做法比较符合他们的习惯。
图二
总体来说,本文的做法非常直接,将统计领域非常成熟的方法集成为一个系统,用以解决一个任务。从可视化的角度来说,未免过于简单。但是不得不承认这样的做法确实有效,容易得到领域专家的认可。
妥善有效地解决一个问题,对于一个可视分析系统来说,可能就足够了。

香港科技大学计算机系代理主任郑绍荣教授来访

昨日,香港科技大学计算机系代理主任郑绍荣教授来访实验室,做了主题为《Meshing Piecewise Smooth Complexes》的精彩报告。报告结束后,郑教授与屈华民教授一同到我们可视分析小组参观,听取了小组最近的一些工作展示,并为我们的工作提出了宝贵的意见。

从不受待见到趋之若鹜(访美札记之五)

本篇借用了他人的一个题目。收藏界有一个有趣的现象:很多当代最受追捧的钱币(价格随之高企)在发行之时或发行之初都是不受待见的品种。这些币刚刚发行时,由于种种原因造成发行量低或返熔量大,结果几十年后反倒成全了它们,成为藏家趋之若鹜的品种。

做研究与其非常相似。科学研究与工程开发不是一锤子买卖,不是投机,是一项投资的长跑。大家知道,可视化一直被认为是图形学中的一部分,在中国只有早期热火了一段时间,其后沉寂了10余年。直到现在,中国大陆的可视化研究仍然非常初步和冷清,缺少一些高层次的key players,因此也就难以引起人们的重点关注。去美国访问的几个学校,碰到好几个教授,都说美国现在可视化开始火起来,10余所学校招数据可视化的新faculty,但是难以招到合格的人才。由此凸显长期不受重视所造成的稀缺性。中国的节奏总要比美国慢半拍。2013年12月5日,中国计算机学会的大数据专业委员会发布了大数据白皮书(http://www.csdn.net/article/2013-12-04/2817708#6874737-tsina-1-57304-3048ae643c93bac2c9a415075e9789bc),总算官方上认可了数据可视化的重要性。

可视化不受待见的原因有很多,其中一个就是宣传。Harry Shum在任微软亚洲研究院的时候,大力鼓吹SIGGRAPH,一时大陆掀起图形学热潮。现在,语音学专家洪小文(微软亚洲研究院院长)是怎么说的呢?

1. 可视化和早期的Cobra编程语言有类似之处。Cobra看起来很不成熟的样子,但在商务里面用得很广,因为领导都能看得懂。可视化也一样,专门给领导看的。数据中的关键东西做出可视化,给领导一讲,马上就懂了。

2. 那有人问,我们不是已经有各种报表了吗?大数据的可视化一定是互动的(Interactive)。如果是报表里的图,领导如果想看点儿别的东西,你说,那我回去准备一下。等你准备好再回来,决策的时机可能就没有了。互动的可视化系统,只要一点,新的图就马上生成了。

3. 可视化系统不能让工程师来做。让他们来做,又搞出个matlab一样的东西,领导又看不懂了。现在很多startup已经做出不少很不错的产品了。

   高手就是高手,把事情说得又清又明。有不少人说,IEEE TVCG的影响因子远小于ACM TOG,因而只是图形学的第二名期刊。现在,大家意识到一些与影响因子有关的原因,IEEE TVCG明年起将VIS会议的特刊从10月改到1月,这样做会显著提高影响因子。

我的感觉是,接下来10年是做数据可视化和可视分析的攻坚期。尽管大数据时代泡沫很多,但沙子里总有金子,埋头苦干,做好了前途一片光明。

 

 

使用扩充极值图检测标量场中的对称性

论文:Detecting Symmetry in Scalar Field Using Augmented Extremum Graph

会议:SciVis 2013

作者:Dilip Mathew Thomas and Vijay Natarajan, Member, IEEE

对称性在许多学科中具有重要的研究价值,对数据中隐藏的对称性进行可视化能够帮助科学家更深入地观察理解实验结果。目前,检测几何体的对称性方法已经有深入的研究,但是标量场中对称性检测的技术仍不够成熟。本文将geometry信息扩充进extremum graph中,使用augmented extremum graph进行标量场中对称性的检测,相比于之前的方法更加高效,能够检测各种刚体变换下的对称性,同时在有显著噪声的干扰下也能有较好的表现。

本文使用了Morse Decomposition对标量场进行分割,其中标量场中每个极大值定义一个分割——即在该极大值点终止的所有梯度最大路径的集合,叫做Morse Cell。通过Morse Decomposition可以构建出extremum graph,如下图所示。相邻的cell通过shared saddle连接。

基于划分的回归模型构建验证框架

论文: A Partition-Based Framework for Building and Validating Regression Models

会议:VAST 2013

作者:Thomas Muhlbacher, Harald Piringer (VRVis Research Center)

回归问题是统计分析领域的永恒话题之一。统计学习领域有相当多的研究成果用于对回归模型进行拓展和改进,然而当前纯自动算法仍然存在以下问题尚待解决:

  • 特征子集选择:如何选择具有特征的维度,以及维度个数与模型可解释性、模型复杂度之间的权衡;
  • 将Domain Knowledge融入特征子集选择过程中:用户通常在维度选择上有一些先验知识,这些知识怎样输入到模型训练中;
  • 特征尺度变换:如何选择合适的变换尺度

本文通过构建一个可视分析框架,很好地弥补了上述问题。本文贡献如下:

  • 基于特征辅助模型预测程度的排序方法
  • 用于展示单一维度/维度对上数据局部结构的可视化视图
  • 验证和比较模型的工作流框架
  • 长时间的用户测试

继续阅读 =>

用于稀疏纤维结构可视化的轻量的基于实物的3D交互

论文: A Lightweight Tangible 3D Interface for InteractiveVisualization of  Thin Fiber Structures

会议: SciVis 2013

作者: Bret Jackson, Tung Yuen lau, David Schroeder, Kimani C.Toussaint and Daniel F.Keefe

本文为了针对稀疏的纤维结构的体绘制结果,能够更好地观察到数据内部的分布情况,定向信息,提出了一种轻便的、基于实物道具的3D的交互手段。本文需要一个深度感应的相机设备和低成本的3D显示设备来实现本文的交互。本文的主要任务是可以帮助相关领域的专家更好地理解三维的纤维结构体内部的方向信息,来判断其衍化出来的各类信息。系统的设计和评论都与两名医学专家进行了合作。与在医学领域的传统交互相对比,本文的新可视化系统提供了一个钟更加有效的方法来检查和理解他们收集到的3D医学数据。 继续阅读 =>

从来只有老师请学生 (访美札记之四)

D是我今年暑假才认识的一个朋友。他和我的研究领域不相关,暑假来浙大访问,和我们学院的另一个课题组合作。期间偶然拜访了我们实验室,并在小组内做了一次演讲,一见如故。我推荐他在不同地方做了另外三场演讲。D住在我们小区一个月,每天早上在小区内跑步,穿了一件有很多很大的破洞的圆领衫,1.80的细长个子,在做早操散步的大妈面前像一只大鸟飞过,很是吸引眼球。

我们到达美国的第一站就是回访D所在的学校N,正好赶上10月19日的一场橄榄球比赛。D的学校我之前从未听说过,到了后听D的详细介绍才有所了解。这所学校位于美国中部,创立于19世纪中叶,是全美非常有名的天主教立校的保守学校,校内有一所漂亮的天主教堂。学校属于小而精的传统美国名校,本科教育蜚声全美。由于宗教、传统和橄榄球队的影响,校友归宿感极强,校友网络遍布全国,每任美国总统都要来学校参加一次毕业典礼。学校管理的基金达90亿美元,相当有钱和人性化:本校职工去世,帮助安排其家属就业;本校职工的小孩读私立大学,学校会赞助一半的学费。

D的家族史可谓是中国近代史的一个缩影。他是广东人,上几辈一直遵循一种广东人出国的传统:父亲在美国打工,成年后娶妻生子将家庭留在广东生活,等后代长大后再带到美国工作。他父亲1950年代返回广东,死于文革。1978年他考上W大学,两年后被在美国的舅舅接到旧金山读大学,1992年毕业于普度大学。读博期间认识了现在的太太,来自东北的H教授。H教授性格大方,善于交际,从事的研究方向和D不一样,但都是计算机学科。学校为了留住D,把夫妻两人招到一个系,两人办公室在隔壁。H教授善结人缘,当过学校的副校长。D性格则相反,个性清高,研究之余,痴迷于中国古代文学,喜欢作诗吟词,静思长想。

D善于总结和思考,喜欢用隐喻描述事物,描述概念、讲道理通俗易懂。尽管H在外呼风唤雨,在内却全然听命于D。他们的两个双胞龙凤胎,许是因为结合了两人的优点,分别考上了哈佛大学和麻省理工学院。全家可谓是功德圆满。

D非常健谈。看橄榄球的那日,他的一个在外州做教授的学生专程坐飞机回来和我们一起看球。D包吃包住。在餐厅吃完晚饭,D一定要付帐,慷慨激昂地说了一句:做了教授,工资每年有20多万,花都花不完。和学生吃饭,从来只有老师请学生,这样才有老师的样子。我觉得这是他说的话中最有趣的一句。

大学学费和经费 (访美札记之三)

几年前听说美国大学学费很贵,斯坦福大学的图形学教授Marc Levoy抱怨他的儿子读不起斯坦福的本科,觉得蛮奇怪的。这次访问了2所全美相当有名的私立大学以及4所公立大学,听其中的一个教授C说起,才知道美国私立大学确实要价不菲。大学四年读下来,学费、生活费加起来要20多万美元了。C教授说,他们学校比较仁慈,本校职工的小孩考上私立大学,学费的一半由学校承担,因此他的两个上哈佛、MIT的双胞胎读书的压力就不太大。中国大学的学费相对来说不高,类似于美国的公立大学。但美国的公立大学整体上的本科教学质量远远不如私立学校,因此美国的学区房也是炒的火热(例如,硅谷的学区房是中部的4倍)。中国目前没有好的私立高校,质量最好的高校仍然靠国家拨款。最近中国提出的高校去行政化可能是高校体系改革的前奏。

到了研究生阶段,除了少量自费的学生,大部分学生(特别是中国、亚洲等地)都需要申请学校的助教(教务处)或助研(导师的经费资助),在导师的课题组从事研究活动。美国读博士需要交学费,大概一年4-5万美元,由导师的经费出。导师经费再出生活费一个月1500-1800美元(中期考核前后有区别)左右,相当于美国普通店员的收入。因此,美国科研经费里70%是人工费。CS博士毕业起薪8万左右。

与之相反,中国读博士不需要交学费。浙大规定博士学生中期考核后3500-4300每月(其中导师出一半,必须是人工费),相当于中国普通群众的收入。但是,中国科研经费里10%-15%是人工费。CS博士毕业起薪8万左右。

具体到IT行业,中美两国目前都很景气,工业界对学生的吸引力很大。计算机学科的学生真正愿意读博士的大体有两类:真正有兴趣做科研的(美国牛校中最顶尖的还是美国人,因为他们是为了兴趣而读博)、或者为了赴美/读博而读书(美国一些中部学校50%的研究生都来自亚洲;浙大很多博士生来自非211高校)而必须读博的。

现在,在各个国家的各个高校,招合适的博士生进入科研队伍,是计算机学科的导师的头等大事。

信息产品的用户体验设计

1. 为什么用户体验如此重要

在问及“在什么情况下你会选择卸载一个软件/系统”,答案无非三种:

  • 这个软件/系统给不了我想要的
  • 这个软件/系统有我想要的,可是我拿不到
  • 这个软件/系统有我想要的,我拿得到,可是这个过程太痛苦了

可以看出,后两个原因与用户体验息息相关。可是,一些不注重用户体验的开发者将百分之九十的精力放在了用户三分之一的关注点上。可想而知,如此设计出的产品或多或少都会有可用性缺陷。尤其是在“用户”扮演了重要角色的可视化系统中。

2. 什么是用户体验设计

创建吸引人的,高效的用户体验的方法叫做以用户为中心的设计(User-Experience Design)。它要求设计系统的每个步骤中,都要把用户列入考虑范围;在以用户为中心的系统设计中,开发者应该将思路从传统的“这个系统用来做什么”转变成为“这个系统要如何工作”。

继续阅读 =>

纽约市出租车数据可视化研究

Visual Exploration of Big Spatio-Temporal Urban Data:A Study of New York City Taxi Trips

作者:Nivan Ferreira, Jorge Poco, Huy T. Vo, Juliana Freire, and Cl ´ audio T. Silva

来源:VAST2013

本文主要对纽约市的出租车数据进行可视化,支持用户可视查询。系统主界面如下:

继续阅读 =>

第 23 页,共 36 页« 最新...10...2122232425...30...最旧 »