Finding Similar People to Guide Life Choices: Challenge, Design, and Evaluation
文章标题: Finding Similar People to Guide Life Choices: Challenge, Design, and Evaluation
来源: CHI 2017, 获得Best Paper Honorable Mention (top 5%)的荣誉
作者: Fan Du, Catherine Plaisant, Neil Spring, Ben Shneiderman
作品网页: http://hcil.umd.edu/peerfinder/
一、基本问题与动机
-
提出了寻找相似个体来指引人生所面临的挑战
-
实现了一个灵活的原型系统, 它允许用户探索不同层次的控制和上下文、并优化寻找结果
-
原形系统不同界面配置、基于此的用户调研与访谈
二、寻找相似个体所面对的挑战
作者认为有五大挑战:
- 对结果中蕴含的证据的信任
-
没有现成的可计算的距离度量(个体间, 或者不同时间序列之间)
-
人们对于相似的主观性
-
人们所求的相似性出于什么目的
-
没有ground truth的benchmark数据, 因为这是一个新领域没有相关的事实积累
三、通过采访来进一步启发设计
上面的挑战分析强调了对搜索提供一定程度的控制的必要性; 为了进一步理解用户想怎样指定使用哪种准则 如何展现结果和上下文 才有了下面的采访. 采访一共13人, 来自不同领域, 设定了不同场景来提供一些阐述. 研究者们想要关注的是, 他们被试者
- 从相似记录里想得到什么信息?
-
寻找相似记录用什么准则?
-
什么样的信息能增加他们对结果的置信度?
通过这些采访, 和之前的挑战分析, 作者概括了这样的设计需求: 其中前两者是对搜索过程提供控制, 后两者是对结果提供上下文. 最后一个由于和本文限制的背景游离, 在本文系统中未体现, 但相关作品也已经有了.
- 动态的准则指定
- 准则的权重分配
- 独有特点的识别
- 查找结果的回顾
- 目标驱动的探索
四、系统设计
系统有baseline, simple 和 complex三种配置, 我们仅介绍complex, 具体可以在作者项目页看到.
四个视图, 各司其职, 十分容易理解. 左上角的视图是要被搜索相似记录的种子记录, 用一个表格的形式结合时间轴, 展现不同事件; 控制器控制搜索条件, 可以指定权重, 指定近似区间, 指定精确匹配还是模糊匹配等; 相似记录排名表是一个相似记录的具体呈现, 每人一个表, 形式同种子记录; 相似记录概览是对排名表的一些统计信息.
系统的搜索方法分两步走, 先是过滤, 用精确匹配消除不匹配的记录; 然后排名, 近似匹配来排序上面过滤后得到的相似记录. 对于不同类型数据(类别型, 数值型, 时序型)的准则有不同的差异性计算方式, 最后加权平方、取欧氏距离.
五、评估
六、讨论
- 由于每个人都做了所有版本, 难免对baseline会很失望
- 从简到繁其实中间还有很多版本, 并没有完全尝试
- 如果相似样本数量很少该如何解决, 这时候置信度又会怎样
- 没有ground truth
- 应用场景局限于学生