Home > 其他 > #FluxFLow: Visual Analysis of Anomalous Information Spreading on Social Media

#FluxFLow: Visual Analysis of Anomalous Information Spreading on Social Media

#FluxFLow: Visual Analysis of Anomalous Information Spreading on Social Media

Jian Zhao,NanCao,ZhenWen,YaleSong,Yu-RuLin,andChristopherCollins

# FluxFlow是一款可视分析系统,用于可视化和分析社交媒体中的异常信息扩散。本文的数据来源于分析对象是Twitter的跟贴信息。

对社交媒体的研究有两个主要问题,“哪些消息流值得观察?”和“被选出的消息有何不同?”。针对这两个问题,本文分别设计了基于OCCRF(One-Class Conditional Random Fields Model,单类条件随机场)的数据挖掘算法和用于查看数据挖掘结果和其内在隐含信息的可视化设计。系统基本构架如图

OCCRF的特点是有着时序依赖、单类以及无需标注好的训练集,其结果是一个作为异常度度量的“异常分数”。本文主要用了以下几类特征作为OCCRF:

C1 用户简要特征,C2 用户网络特征,C3 时序特征,C4 内容特征

可视设计方面,用一个圆形的设计表达一个跟帖(及其后的所有回复),圆的半径是跟帖内回复的用户数,内圆颜色编码了情绪指标(从上面C4类的两个特征中提取),外圆颜色编码了“异常分数”,颜色越偏向紫色则越异常。还用扇形的开始和结束位置编码了跟帖的时间跨度。

这个圆形设计被用在了很多地方,如可视化的主要视图

MDS投影和层次聚类视图

图中除了上述圆形视图外,还有一些简化了的小圆,即没有被选中的数据,其编码是通过颜色表达一些(上面特征表中的)用户信息。

除此之外还能表达一些关系信息,如同一个人的多次回复,好友关系(下图)等

除此之外,还有一些详细视图如OCCRF中隐含变量的时序分布(下图d)、MDS分布(下图e)、具体回复内容(下图f)等。

本文还用多个案例介绍了系统的使用方法、OCCRF内在隐含变量与结果的关系等。

分享到:

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>