搜索结果 分类目录: 其他

科学数据可视化中的一种高效的区间分布查询方法

作者 Abon Chaudhurl, Tzu-Hsuan Wei, Teng-Yok Lee, Han-Wei Shen

pvis2014 文章

区间分布查询是指对用户给定的一个1D或者2D或者3D区间,通常是xyz三个空间尺度内的大小(1D,2D,3D),返回区间内变量场的统计特性。例如,均值,标准差,熵等。

它的作用包括特征抽取,不确定性量化,数据压缩等。现存方法通常是对查询区间的变量场进行扫描计算,若查询区间大小或者相关参数发生变化,需要重新计算,时空负载过大,并且时空代价往往随着查询区间的尺度增加而增加。

针对上述问题,本文作者提出一个无视数据大小和查询区间大小的、常量应答时间的、低时空负载的区间分布查询框架。 继续阅读 =>

浙江大学可视分析小组“数据与人文社会科学”学术沙龙顺利举行

2014年5月7日,“数据与社会科学”研讨会在浙江大学紫金港校区蒙民伟楼402会议室顺利举行。

数据与人文社会科学的研究范围已经发生很大变化,越来越注重以人为本的数据分析形式。会议探讨数据与人文社会科学的研究现状、发展趋势及面临的挑战,如何与当前的整个领域内的热点问题的发展相匹配等科学前沿问题。

会议由浙江大学计算机学院陈为教授主持。会上,浙江大学可视分析小组介绍了他们的工作,包括传感器网络数据分析、基于交通轨迹数据的交通状态评估、基于地图多源数据的贝叶斯网络分析、国家气象局全球尺度三维大气可视化平台、电子商务数据的异常交易检测和关联分析等。

研讨会特别邀请了数十名来自浙江大学计算机学院、经济学院、传媒学院、管理学院、数学学院,浙江工商大学经济学院、计算机学院,法国图卢兹大学,杭州七巧板公司的专家。近60余位师生参加此次研讨会,现场与专家们就相关数据与社会科学进行热烈的学术交流和讨论。 继续阅读 =>

ExPlates: 用户对数据的分析探索过程的可视化

题目:ExPlates: Spatializing Interactive Analysis to Scaffold Visual Exploration

作者: B.Preim, P.Rheingans, and H.Theisel

发表会议: EuroVis 2013

 

数据驱动的数据分析探索通常会让用户有很大的认知负担。用户需要有能力去理解探索过程中生成出来的视图,还要能记住之前的探索步骤得出来的结论并基于这些结论进行下一步探索。为了减轻用户在可视探索过程中的认知负担,这篇文章设计并实现了ExPlates。系统中提供的各种功能的部件帮助用户在探索过程中构建图形化的历史记录,保存记录了探索过程中的每一个分支。

 

下图是系统的主界面:

 

 

左边是一张svg画布,各种功能的部件会在这里创建。

右边是系统的menu,能载入数据,添加可视化模板,添加数据处理模板等。

 

本文用了两个case介绍了这个系统的使用流程。

第一个case用到了两个数据集,第一个是196个国家的人均预期寿命数据,第二个是120个国家的基尼系数数据。 继续阅读 =>

浙大经济学院副院长潘士远和法国图卢兹大学何英华教授来访

2014110日下午,浙大经济学院副院长潘士远和法国图卢兹大学何英华教授一同来访VAg小组,与陈为教授进行了大数据上与经济的学术讨论。下图中右一为潘士远副院长;左一为何英华教授。

 

原韩国KAIST的主任Shin教授与UC Berkley一年级博士生姜碧野来访

2014110日下午,原韩国KAIST的主任Shin教授与UC Berkley一年级博士生姜碧野(毕业于清华大学胡事民老师组)来访VAG小组,与陈为教授、陈海东、吴斐然等进行了讨论交流。图中左二为Shin教授,他的主要研究方向为动画、图形学;下图左一为姜碧野,他的主要研究方向为数据挖掘、人机交互、可视化。

 

从不受待见到趋之若鹜(访美札记之五)

本篇借用了他人的一个题目。收藏界有一个有趣的现象:很多当代最受追捧的钱币(价格随之高企)在发行之时或发行之初都是不受待见的品种。这些币刚刚发行时,由于种种原因造成发行量低或返熔量大,结果几十年后反倒成全了它们,成为藏家趋之若鹜的品种。

做研究与其非常相似。科学研究与工程开发不是一锤子买卖,不是投机,是一项投资的长跑。大家知道,可视化一直被认为是图形学中的一部分,在中国只有早期热火了一段时间,其后沉寂了10余年。直到现在,中国大陆的可视化研究仍然非常初步和冷清,缺少一些高层次的key players,因此也就难以引起人们的重点关注。去美国访问的几个学校,碰到好几个教授,都说美国现在可视化开始火起来,10余所学校招数据可视化的新faculty,但是难以招到合格的人才。由此凸显长期不受重视所造成的稀缺性。中国的节奏总要比美国慢半拍。2013年12月5日,中国计算机学会的大数据专业委员会发布了大数据白皮书(http://www.csdn.net/article/2013-12-04/2817708#6874737-tsina-1-57304-3048ae643c93bac2c9a415075e9789bc),总算官方上认可了数据可视化的重要性。

可视化不受待见的原因有很多,其中一个就是宣传。Harry Shum在任微软亚洲研究院的时候,大力鼓吹SIGGRAPH,一时大陆掀起图形学热潮。现在,语音学专家洪小文(微软亚洲研究院院长)是怎么说的呢?

1. 可视化和早期的Cobra编程语言有类似之处。Cobra看起来很不成熟的样子,但在商务里面用得很广,因为领导都能看得懂。可视化也一样,专门给领导看的。数据中的关键东西做出可视化,给领导一讲,马上就懂了。

2. 那有人问,我们不是已经有各种报表了吗?大数据的可视化一定是互动的(Interactive)。如果是报表里的图,领导如果想看点儿别的东西,你说,那我回去准备一下。等你准备好再回来,决策的时机可能就没有了。互动的可视化系统,只要一点,新的图就马上生成了。

3. 可视化系统不能让工程师来做。让他们来做,又搞出个matlab一样的东西,领导又看不懂了。现在很多startup已经做出不少很不错的产品了。

   高手就是高手,把事情说得又清又明。有不少人说,IEEE TVCG的影响因子远小于ACM TOG,因而只是图形学的第二名期刊。现在,大家意识到一些与影响因子有关的原因,IEEE TVCG明年起将VIS会议的特刊从10月改到1月,这样做会显著提高影响因子。

我的感觉是,接下来10年是做数据可视化和可视分析的攻坚期。尽管大数据时代泡沫很多,但沙子里总有金子,埋头苦干,做好了前途一片光明。

 

 

VIS2013中和Tamara Munzner的对话

(编者按:本组学生summer酱有幸赴美参加VIS2013会议,以下是她在会上与可视化领域著名学者Tamara Munzner的交流记录,经summer本人同意后发于本博客,与各位同仁共勉。)

今天有幸能在茶歇的时候和UBC的大佬Tamara Munzner交流,我把问题整理了一下和大家共享,顺便表达一下我对她的仰慕之情。

其实我们问的问题跟她的回答和后面的panel内容还比较相关的,关于design practice,因为对话是从我读了她那本书开始的。

Q1:如何开始一个problem-driven的project工作?

她提到可以关注一下她去年的那篇methodology的paper (Design Study Methodology: Reflections from the Trenches and the Stacks)。但是作为一个problem-driven的项目,设计或者实现工作真正开始之前的第一步一定是明确领域/问题的真正需求,这就要和领域专家反复的沟通,因为领域专家和设计师看问题的角度不同(they speak different languages)。比如领域专家讲了一大堆问题的背景、需求、想要达到什么效果,设计师听到的可能只有其中的一些关键词如“过滤”、“分类”、“聚合”,而可能设计师所听到的“过滤”并不是他们所理解的那个过滤(filter)。就像我们说一个问题的方法可以迁移(transfer)到另一个问题上,机器学习领域的同学迅速抓住了transfer这个关键词,开始yy这跟迁移学习有什么关系,但其实没什么关系一样。因此和领域专家的交流和沟通一定是反复的、增量式的。

继续阅读 =>

苍南支教札记

2013年10月28号至11月9号我在浙江省温州市苍南县的双灵小学进行支教,同行的还有CAD实验室的另一位同学。

双灵小学地处较偏,学校的四周都是稻田,我们要坐公交车往返学校和住宿之间。学校一共160个人左右,全部教职工一共11人。学校去年才有专业的英语老师任教,之前英语教学一直是其他的老师进行代课。大部分的学生来自邻近的两个村子,有部分是住在当地的外来打工者的小孩。家比较远的孩子中午会在学校里面吃饭,学校的所有老师和我们两位支教的中午也一起在学校吃饭。

每天早上在学生们朗朗的读书声中步入学校,校门口值班的学生总能朝气蓬勃地向我们问“老师好”,新的一天开始了。每次走在校园里,听到认识或者不认识的学生热情地向我问好,总会异常开心,也会突然觉得教师这个职业的确很光荣。来这里了几天,感觉到了身为老师的骄傲,也逐渐感受到了老师的责任。学校的孩子都很活泼,脸上都挂着笑容,课间和课后大家会一起玩耍。

每天学校上下午各安排3节课,这样平均一个老师一天就有三四节课。通常一个老师要教两至三个年级的三到四门课,由于学校老师少,一旦哪个老师有事情请假,其他老师的课就会比较多。我们的支教的确起了很大的作用。我在学校支教两周的时间中,一到六年都教过,各个科目的课程也都教授过,包括语文、数学、英语、美术、思想品德、地方课程、科学课等。上语文课,给学生们讲解《仓颉造字》的课文,我从网上找了关于这个传说的视频以及汉字的演变的视频,这些视频带有动画性质,学生们比较感兴趣,学习的热情非常高。上六年级美术的时候,我从网上找了一些画家画的二义性的或者现实中不存在的、或者锻炼智力的图片让大家观看,发现也能立刻激起他们学习的兴趣。在课堂上我会尽量多进行提问,这样可以让学生更集中注意力。他们回答得比较好的时候,我会进行表扬,这样他们比较有信心;即使回答得不太好,我也会给予鼓励。孩子们的好奇心很强,课堂气氛都很活跃,尤其是看到我们这些去支教的老师会问东问西。第一天支教自己可能也没有多少经验,加上有四节课,学生们也都比较调皮,结束后特别累;但是觉得很充实,心里是满满的成就感。孩子们虽然很调皮,也很可爱,跟他们在一起会觉得自己也富有朝气,充满活力。

继续阅读 =>

计算机和医学双料博士 (访美札记之一)

2013年10月18日到2013年11月14日,我在美国游历了5所高校、1个研究院和硅谷,接受了一次美国教育和科研的洗礼。凭记忆写下一些小故事,供大家回味。

(一)计算机和医学双料博士

访问某大学时,与多年的好朋友M教授偶然聊到他的一个学生N。N的名字是我们组的小丁同学在课题背景调查时获悉的。小丁和我想在科学数据的可视化中找一块硬骨头去啃,我们认为大尺度科学数据的压缩是一个非常有意义的难题。N和M连续在可视化顶级会议IEEE SciVis上发表了两篇关于三维体数据压缩的论文,特别是第二篇论文实现了浮点型体数据的无损压缩,走在了世界研究前沿。两篇论文中的大篇幅内容是信号压缩方面的一些数学推导,普通人非常难以理解。我和小丁讨论后的结论是,N一定是一个专门做数据压缩的专家,和M在三维体数据压缩方面合作,完成这个神作之合。

M教授听到我对N的工作感兴趣,讲述了他的一段有趣的故事。N是一个美国学生,本科阶段加入M的小组,显露了他在科研方面的过人素质。N做事非常专一,完全凭个人兴趣行事,只要瞄准的事情,一定做到底,且拼尽手段达到目标。三维体数据压缩的题目,是M从NASA的科学家们那里获得的题目。N在没有任何专业背景的情形下,翻阅了图书馆所有有关数据压缩的书籍,单枪匹马提出并实现了两个高质量算法。其中关于浮点型体数据的无损压缩的论文,由于论文篇幅限制,省略了大段推导文字。

M教授笑眯眯地说,N的神奇之处不仅在于他在可视化研究方面非常出色,还在于他的离奇学历。N读博时认识了一个女友,是医科博士生。期间,N中断学业,跟随女友去了非洲一年,为难民提供医疗服务。回美国后,N郑重告诉M,他的理想是为全世界受苦难的人民提供更好的医疗服务,这个梦想的重要性远远超过做科学数据的可视化研究。于是,他决定去医学院读医科MD。说到做到,他立刻休学,加入了另外一所大学的医学院,苦学了若干年。可惜的是,女友和他分了手。

M觉得N的资质非同小可,如果放弃唾手可得的CS博士学位非常可惜。于是又劝说他回到学校,干了半年,圆满完成了博士论文,获得CS博士学位。目前,他已从医学院毕业,在华盛顿的一家著名医院做了住院医生,从此告别了计算机界。M认为,N的做事风格决定了他在临床方面也一定会获得成功。

基于信息论的多变量数据探索框架构建方法

文章:An Information-Aware Framework for Exploring Multivariate Data Sets

来源:SciVis2013

作者:Ayan Biswas, Soumya Dutta, Han-Wei Shen, Jonathan Woodring

本文主要介绍了一种基于信息论的多变量数据可视分析框架构建方法,流程如图1所示

图1

继续阅读 =>

第 16 页,共 17 页« 最新...10...1314151617