是什么特质让Hamlet如此Hamlet?
作者:Michael Gleicher
会议:IEEE VAST 2013 Honorable Mention
本文介绍了方便用户添加标注,并且可以解释的投影函数的构造方法。
这是本文方法对不同城市的各种指标构造的线性一位投影结果的可视化。
140个城市从左到右,从上到下依次排布,代表其投影的序列。紫色代表用户标记的美国城市,绿色代表其他城市。作者仅仅用了三个城市指标:Healthcare indicators,sports event以及public healthcare。每个维度在线性投影的函数中的权重也为-1,0或1。这样的投影函数满足多个优良的属性:
准确性:分类结果要准确
简单性:分类结果要容易解释
多样性:提供多种分类函数供选择
统计属性:代表性等等其他属性
本文方法用莎士比亚戏剧的案例案例:
下图展示了作者对莎士比亚戏剧的分类:
每行代表一部作品,每行的五格代表一部戏的五幕场景。
绿色代表风格很接近Hamlet,紫色代表风格与Hamlet不同。前三个是本文方法的分类效果,都是用了三个特征做分类;后两个是普通SVM的效果。
可以看到作者的分类效果并不理想连Hamlet本身(12行)的五幕都没被分为一类。而最好的第五个SVM使用了26个维度才将勉强将Hamlet分类出来。
于是作者的结论是:Hamlet没有显著特征!
乍看似乎很可笑,代表了莎士比亚戏剧创作的最高成就怎么可能没有独特之处呢。
再看看文学评论家的说法,就发现Hamlet是一部充满矛盾,不连续以及不确定性的作品。我们可能很难用简单的维度来描述其特征。Hamlet的其魅力所在就在于此。