TrajGraph: A Graph-Based Approach to Studying Urban Network Centralities Using Taxi Trajectory Data

论文:TrajGraph: A Graph-Based Approach to Studying Urban Network Centralities Using Taxi Trajectory Data

作者:Xiaoke Huang, Ye Zhao, Jing Yang, Chong Zhang, Chao Ma, Xinyue Ye

发表会议:VAST2015

介绍

出租车轨迹在一定程度上反应了整个城市道路的动态交通信息,我们可以从出租车轨迹观察到真实的交通流以及城市级别的交通模式。为了反应道路结构,过去的研究往往采用图模型的方法,但是他们只考虑的静态的路网数据,没有使用真实的交通数据,进几年来的工作也不能反应城市范围的路网并且支持交互式分析。为此,作者提出了TrajGraph。TrajGraph同时结合了路网结构和真实的出租车数据。为了支持交互式分析,TrajGraph做了空间简化,使用了图分割算法,把街道级别的图模型转换为区域级别的图模型。同时,为了研究分析城市中不同区域在交通中的重要程度,作者基于TrajGraph计算了图的中心性,包括Pagerank和betweenness。这些中心性由三个联动的视图:结点连接图、地图和时间信息图可视化展示出来,用户可以交互式地分析探索城市交通的模式。

构造图

首先,基于路网和出租车轨迹信息,我们可以构造一个图模型。如下图,我们把每一个街道转换为一个结点,在街道间的转换就是一条边。比如,有一辆出租车从道路D行驶到道路F,那么在对应的图模型中就会生成结点D和F以及边DF。这是考虑了一些道路上的约束,比如不能从道路C行驶到道路A,这样的约束很容易在这样的图模型中表示出来。边的权重统一设为1,结点的权重可以有四种,路段长度、出租车数量、平均通行时间和平均速度。前一个反应了道路结构,后三个都是反应了交通信息。

继续阅读 =>

G2(The Grammar Of Graphics)公开分享课

时间:2016年5月27日(星期五)

地点:浙江大学紫金港校区蒙民伟楼CAD&CG国家重点实验室421室

本周组会之后,将有支付宝前端的工程师向大家介绍蚂蚁金服最新推出的可视化语言G2。

相关链接:http://g2.alipay.com/

G2(The Grammar Of Graphics) 是一个由纯 javascript 编写、强大的语义化图表生成工具,它提供了一整套图形语法,可以让用户通过简单的语法搭建出无数种图表,并且集成了大量的统计工具,支持多种坐标系绘制,可以让用户自由得定制图表,是为大数据时代而准备的强大的可视化工具。

G2 的强大是由其背后的一套图形语法所支撑的,它基于《The Grammar of Graphics》(Leland Wilkinson 著)一书,它由一系列独立的图形部件组成,并能以多种不同的方式组合起来。数据可视化是一个数据到图形的映射过程,所以所谓的图形语法就是:

『一张统计图形就是数据到几何图形对象(Geom)的图形属性(Attrs)的一个映射,此外图形中还可包括数据的统计变换(Stat),最后绘制到某个特定的坐标系(Coord)中,而分面(Facet)则可以用来生成数据各个子集的图形。』

继续阅读 =>

Spatio-Temporal Modeling and Prediction of Visual Attention in Graphical User Interfaces

这篇文章中,Pingmei Xu等人提出了一个 对于GUI中人的视觉注意进行时空预测的模型。这个模型基于图形界面、用户的鼠标和键盘输入,不依赖于眼动追踪仪器,能够帮助我们很好地捕捉和预测用户在GUI上的注意力。

在人机交互的领域,视线(Gaze)有着重要的意义。它既可以作为外显的输入,用于对沉浸式设备(例如虚拟现实眼镜)进行交互控制,同时也是一种内隐的输入,表现用户的兴趣与关注。在人机交互中,视线的使用也有着一些基本的局限性。对于视线的估计需要特殊的眼动跟踪仪器,这些仪器往往造价不菲,难以入手,因此并非在大多数场合都是通用的。此外,眼动追踪仪只能告诉我们用户视线当前和过去位置,无法预测用户未来可能关注的位置。对于这些问题,一种常见解决办法是使用视觉注意的计算模型。典型地,它会将一张图片作为输入,预测那些局部特征和周围显著不同的区域,认为它们最可能在接下来被用户注意到。这些模型有着局限性,主要在于:没有考虑到用户的其他输入;没有考虑到界面信息;没有考虑到用户的交互历史。

继续阅读 =>

PhenoBlocks: Phenotype Comparison Visualizations

这篇文章中,Michael Glueck等人提出一种可以用于比较患者之间不同的表征,来进行罕见遗传病诊断的可视化系统——PhenoBlocks,医生可以通过该系统比对患者和其他典型患者或正常人的临床表现,从而得出患者可能患有的罕见遗传疾病并能够获得合理的诊断方向。

在医疗领域,医生对于遗传疾病的诊断是一件非常困难的事情,临床患者表现出的表征数据是异构的。医生对于同一类疾病不同患者的医疗记录具有很强的不一致性,不完整性,和粒度不统一性。之前的诊断工具大都是基于文本的。并且没有强调如何保证诊断的一致性,完整性和粒度统一性。本文提出的系统能够通过一个一目了然的可视化界面,使得医生能够对临床患者和典型患者之间进行比较,从而得到完整的具有一致性的诊断过程。

继续阅读 =>

TelCoVis: 基于城市电信数据的人群共现行为的可视探索

TelcoVis: Visual Exploration of Co-occurrence in Urban Human Mobility Based on Telco Data

本文是2015年VIS中SciVis的文章,并被TVCG收录
简介
本文利用广州的的电信数据(telco data)对人口流动(human mobility)中的共现现象 (co-occurrence)进行可视分析. 所谓共现, 简单的理解为来自区域A和区域B的人在同一时间段内到了同一个地方. 这种现象的分析研究有很多实际应用, 例如
1) 帮助城市规划者应对流行病, 帮助社会科学家洞察和建模人的社交 (比如富人与穷人之间的交流)
2) 帮助商店店主了解在特定时间段造访餐厅, 商场的人的类型, 以便进行有针对性的促销, 做出更好的商业决策
3) 帮助管理者估计高峰期在地铁口, 高速公路入口共现的人的数目
随着(智能)手机越来越普及, 收集到的电信数据也更加细粒度, 数据量也愈发庞大. 这些数据使得我们能够进行更好的对人类行为的分析, 比如上面提及的共现现象.
.
继续阅读 =>

AggreSet-基于元素聚合的丰富且可扩展的集合探索

AggreSet: Rich and Scalable Set Exploration using Visualizations of Element Aggregations

M. Adil Yalçın, Student Member, IEEE, Niklas Elmqvist, Senior Member, IEEE, and Benjamin B. Bederson
InfoVis2015
系统预览

图1 系统预览

本文的三位作者均来自马里兰大学帕克分校。文章针对set-typed(类别型多值)属性的可视分析进行了建模,并实现了一个功能丰富、数据可拓展的探索系统。
继续阅读 =>

MotionFlow: Visual Abstraction and Aggregation of Sequential Patterns in Human Motion Tracking Data

人体动作追踪数据(human motion tracking data)由体感装置Kinect捕获得到,包含多帧记录人体各个关节3D坐标的数据。这种数据的可视分析一直以来都是个难点,因为这种数据几乎是分布在无限的时间和空间范围上,而且包含的帧数较多,数据量大且数据结构异常复杂。这篇文章为了解决这个难题,提出了可视分析系统——MotionFlow(图1)。它将动作数据抽象成不同动作状态之间的转移序列,并用几个联动视图进行展现,方便用户发现和探索出一些有趣的动作模式。

图1:系统界面

继续阅读 =>

DemographicVis: Analyzing Demographic Information based on User Generated Content

这篇文章提出一种基于用户生成信息的可交互式分析人口统计资料的系统——DemographicVis,它可以可视化那些从人口统计事实提取或者推断出的特征,以此来以一种透明的方式对人口统计信息进行探索。

因为之前基于年龄和性别的语义分析和根据常用词推断年龄性别等信息的系统都是只是以一种分类方式将人群简单分类,因此提出了使用年龄,性别,教育程度三种指标相结合的分类方式,并且设计了简明新奇的可视分析系统来展现人口统计资料和用户生成内容的关系。文章在最后还进行了user study 与SAS TextMiner 进行了定量的比较。

继续阅读 =>

陈为教授出席云栖大会,助力天池大赛破解污染图谱

由阿里巴巴公益基金会、中国气象局公共气象服务中心主办,阿里云、浙江大学、中国天气网承办的天池数据可视化创新大赛宣布开赛。参赛者可对阿里云天池平台上的各类气象数据与公共环境数据进行分析挖掘,寻找空气、水质、企业排放、气象等数据之间的关系,并用可视化的形式展现出来。

中国的工业排放体系被认为是全世界最复杂的——既有全球最先进的宝钢,也有落后的中西部小钢铁。污染物和污染源本身已经构成了复杂的大数据体系,但要做到“精准治污”同时还要考虑气象数据的影响。

4月27日,陈为教授应邀出席云栖大会·南京峰会,现场展示气象、城市、电子商务等应用的数据可视分析案例,并参与启动阿里云天池数据可视化大赛。

继续阅读 =>

Task-Driven Comparison of Topic Models

在文本处理和数据挖掘领域有一种非常重要的方法,那就是主题模型方法。他能有效的从文本语义中提取主题信息。主题模型主要由词、文档和话题构成。其中文档是要处理的数据源,它由很多词构成。从文档中我们能抽取一些词的集合,最终构成一个个主题。凡是类似这种结构的模型(甚至不仅仅是文本模型),都可以使用主题模型方法。因此,这一种方法有其自身很强的普适性。在过去,尤其是在可视化领域,分析主题模型的工具往往是用来分析其有效性的,对于比较不同的主题模型来说,方法与工具是极其少见的。而这篇论文就是从主题模型的比较入手,通过多种可视化方法来更有效地对不同主题模型的结果进行比较。

对于比较主题模型的比较, 我们比较的不仅仅是方法,不同的方法,不同的主题个数选取,不同的参数,都能产生不同的结果,这些结果甚至可能差异巨大。因此,我们对主题模型的比较不仅仅应该比较不同方法,可能还需要比较不同的参数选取等。

这篇文章对于主题模型的比较,可以从三个方面入手:主题内容、主题相似性、主题时变。其中主题内容主要比较同一个文章不同方法得出的主题内容的差异。相似性比较主要是对使用不同方法导致的不同文章之间主题相似性差异做对比。而最后主题时变则是比较不同模型对于主题变化的影响。下面分别从这三个方面对论文的方法进行阐述。

图1 主题内容比较可视化方法

继续阅读 =>

第 5 页,共 30 页« 最新...34567...102030...最旧 »