基于语义的大规模出租车轨迹交互分析方法(SemanticTraj)

简介:
在城市规划、城市运输及城市交通管理等领域,对于车辆轨迹的信息挖掘和知识提取越来越重要。大规模的城市出租车轨迹数据,能够帮助各个领域的专家分析城市交通和城市人群的移动规律。现有的工作大都围绕对地理位置的框选或刷选来完成数据的过滤。

本文介绍了一种基于语义信息对大规模出租车轨迹数据进行交互式的检索、分析的可视化方法。领域专家或者使用者可以通过输入带有语义的查询条件对轨迹数据进行查询检索,并通过系统的可视化界面对轨迹数据进行探索,从而得到有用的信息。系统通过在轨迹数据上建立了两种文本语义索引文件来加速语义查询速率,并设计了多视图的可视化界面来帮助用户分析轨迹数据。最后通过用户的实验验证了系统的可行性。

问题导向:
大规模的出租车数据对城市交通城市规划等领域提供了很多有用的信息。为了挖掘出这些信息,现有的大量工作研究了轨迹信息的可视分析,轨迹信息的存储和轨迹语义的标注。然而这些工作大都是基于对地理位置的刷选来完成对数据的过滤。对于特定的任务,例如一家商场的管理者,希望知道在城市的什么地点放置摆渡车辆,能够帮助人们来商场购物? 交通警察希望知道哪些路段是经常堵车的路段,那些路段交通状况很好? 如果使用原有的系统来回答类似上述的问题,操作就会十分繁琐。而如果可以直接通过语义来查询满足条件的出租车轨迹信息,那么分析的时间就会大大下降了。

继续阅读 =>

D-Map: Visual Analysis of Ego-centric Information 
Diffusion Patterns in Social Media

论文:D-Map: Visual Analysis of Ego-centric Information Diffusion Patterns in Social Media

作者:Siming Chen, Shuai Chen, Zhenhuang Wang, Jie Liang, Xiaoru Yuan, Nan Cao, Yadong Wu

发表:2016 VAST Conference track

一、简介

本文研究微博上的社交媒体数据,研究目标为:挖掘信息扩散的模式以及重要社交媒体用户在信息扩散的过程中发挥的作用。这样的研究通常面临三个主要挑战:异构社交媒体数据、难以定义的用户影响力和复杂的可视设计。为了解决上述问题,本文提出了一种使用地图作隐喻的可视化设计——信息扩散地图,在该图上展示信息传播的历史过程以及用户行为变化过程。

继续阅读 =>

SAGE2: 支持可拓展像素显示的协作平台

论文:《SAGE2 – A New Approach for Data Intensive Collaboration Using Scalable Resolution》

作者: Thomas Marrinan, Jillian Aurisano, Arthur Nishimoto, Krishna Bharadwaj, Victor Mateevitsi, Luc Renambot, Lance Long, Andrew Johnson. 通讯作者:Jason Leigh

发表:Best Paper Awards of CollaborataCom 2014

 

一、简介

SAGE2 作为一款中间件,支持分辨率可拓展的共享显示(SRSD, Scalable Resolution Shared Displays),通过浏览器支持实时多用户的协同合作:

- 它支持如上所示的原型应用;

- 同时用户可向服务器上传文件、视频 (pixel streams) 来分享工作进展;

- 它也支持多用户实时交互。

http://sage2.sagecommons.org/videos/ 中的视频 ”SAGE2 capabilities” 比较好地描述了 SAGE2 的各个功能。

继续阅读 =>

Vega-Lite: A Grammar of Interactive Graphics

论文:Vega-Lite: A Grammar of Interactive Graphics

作者:Arvind Satyanarayan, Dominik Moritz, KanitWongsuphasawat, and Jeffrey Heer

发表:InfoVis 2016

 

在 InfoVis 2016 上,UW 交互数据实验室 提出了一种新的交互数据可视化语法——Vega-Lite,获得了今年的 best paper,本文将根据其论文从多个角度介绍 Vega-Lite。论文地址

什么是 Vega-Lite?

简而言之,Vega-Lite 是一种数据可视化的高级语法,能够快速定义一些基本的交互式数据可视化。

如果你听说过 Vega,那么光看 Vega-Lite 的名字就不难想到它们的关系。Vega-Lite 就是编译成 Vega 的更高级图形语法。

如下图所示,只要右边寥寥数行代码,就能定义一个散点图:

继续阅读 =>

NameClarifier: 对论文作者姓名进行消歧的可视分析系统

论文:NameClarifier: A Visual Analytics System for Author Name Disambiguation

作者:Qiaomu Shen, Tongshuang Wu, Haiyan Yang, Yanhong Wu, Huamin Qu, and Weiwei Cui

发表:VAST2016 / TVCG

一、概述

        目的: 不同文献中的作者重名问题

        动机:

- 现有的纯挖掘算法往往采用全局模型, 无法处理一些特殊情况 (比如, 同一篇文章重名; 重名者研究领域高度相似; 重名者研究领域随时间发生变化等等)

- 现有可视化方法很少

        贡献:

- 用可视化方法将原本黑盒解法变成一个白盒的过程

- 提供一种引导用户进行分类的方法而不是简单的给出分类结果

- 提出一种两步去重的过程, 迭代的改良分类结果

二、系统流程

给定一个名字, 输入到这里的是所有这个名字的文献的资料Pre-processor: 对每个publication抽取metadata 给Analyzer然后Analyzer首先将所有有明确身份的文章分组(person1, person2等等以及各自对应的文章的集合), 将剩下的标为歧义的文章. 然后将确定的组与歧义的文章比较估计相似性, 利用的是不同时间所发表刊物的一些属性和共同作者的一些数学关系最后Visualizer展现这些关系, 一共有三个view 第一个view主要是分类那些有着歧义名的文章来到现有的确定组中去, 后面两个view主要是来验证前面的初步结论.

System Pipeline

系统流程

三、数据处理

继续阅读 =>

HindSight: Encouraging Exploration through Direct Encoding of Personal Interaction History

论文:HindSight: Encouraging Exploration through Direct Encoding of Personal Interaction History

作者:Mi Feng, Cheng Deng, Evan M. Peck, Lane Harrison

发表:TVCG2016

背景:

人的记忆力是有限的,并且会随着时间衰减。在数据探索过程中,人们需要花费精力记住自己的探索记录。因此,一项可以支持记录交互历史的可视化技术在数据探索研究领域将会有很大影响。

简介:

HindSight是指描述直接在原有可视化系统上展现交互历史的设计原则的涵盖性术语。文章提出了一个假想:在探索性分析中,直接编码的个人历史可以对用户行为产生积极的影响。为了验证这个假想,他们进行了实验:把HindSight用于3个已有的可视化系统中,来检验HindSight原则的价值。

HindSight原则的核心想法是(在数据编码的基础上)将用户的 交互 也编码到可视化设计中。

实验过程:

实验使用了3个交互性的可视化系统(MetaFilter,255Charts,Storytelling),分别设置了实验组和对照组。实验参与者为AMT(“机械的土耳其人”网站)的雇员。

继续阅读 =>

UnTangle Map: Visual Analysis of Probabilistic Multi-Label Data

论文:UnTangle Map: Visual Analysis of Probabilistic Multi-Label Data

作者:Nan Cao, Yu-Ru Lin, and David Gotz

发表:TVCG2015

研究对象:概率多标签数据

一、创新点

- 精确可控的标签节点布局算法

- 提高可拓展性的聚类渲染技术

- 易于理解的评估

继续阅读 =>

A Visual Analytics Approach for Categorical Joint Distribution Reconstruction from Marginal Projections

论文:A Visual Analytics Approach for Categorical Joint Distribution Reconstruction from Marginal Projections

作者:Cong Xie, Wen Zhong, and Klaus Mueller

发表会议:VAST2016

 

介绍

通常情况下,我们获得的多变量数据并不是等多元元组的集合,而是一些属性的子集的投影。例如,我们可能会找到有5个属性的数据,但我们得到的并不是一个完整的表格,这些数据以两两维度存储在六个表中。所以我们想要从边缘分布重构联合分布。目前已知的方法都通过迭代过程来估计联合分布。当前的这些方法存在以下两个问题:一、没有足够的边际分布和专家知识,结果的误差较大。二、如果属性不是数值型的而是类别型的,求解过程中的正则化是不适用的。作者提出了一个结合多种数据和领域专家只是的可视分析方法,以迭代的方法来缩小合理解的数量。

继续阅读 =>

VisDock: A Toolkit for Cross-Cutting Interactions in Visualization

论文:VisDock: A Toolkit for Cross-Cutting Interactions in Visualization

作者:Jungu Choi, Deok Gun Park, Yuet Ling Wong, Eli Fisher, and Niklas Elmqvist

发表期刊:TVCG2014

VisDock提供可嵌入D3代码的JS库,为D3创建的可视化添加额外的工具栏(类似于PS/AI),可以简单地添加各种交互如平移、缩放、框选、添加标签等等操作。

继续阅读 =>

TimeCrunch: Interpretable Dynamic Graph Summarization

怎样描述一个很大的动态图,或者说我们怎么去找出现实中动态图的一些模式,我们怎么评估它们的重要性。这就是这篇文章要解决的问题。纵然有许多的图算法适用于各种情况,但是传统聚类和社团搜索的目标并不是我们现在要追求的。何况它们也不能给出输出的特性的描述。

基于此,本文提出了TIMECRUNCH的算法,把动态图按照有时序标志的静态图的组合,找出成本最小的表示,并从中找出想要找的模式和特殊结构。而且最终,作者应用TIMECRUNCH分析大的动态网络,找到了多种模式和异常状态,这些表明了现实图确实展现了时序结构。

与之前的一些常用方法相比较。TIMECRUNCH可处理多种形式的图。

继续阅读 =>

第 3 页,共 30 页12345...102030...最旧 »