2018年秋季学期视觉计算实验室第11周论文研读预告

论文研读时间: 2018年11月16日9点30分
论文研读地点: 四川大学望江校区基础教学楼B座318(视觉计算实验室)
论文分享者: 熊枭枭(#1)、蒋雨杉(#2)

分享内容 #1:Visual Diagnosis of Tree Boosting Methods

文献来源:IEEE Transactions on Visualization & Computer Graphics
分享理由:

  1. 文章的研究内容契合本人学位论文研究方向:可解释机器学习模型;
  2. 文章中对于混淆矩阵的可视化设计有着值得借鉴之处;

内容简介:
        Tree boosting是一种高效且广泛应用的机器学习方法,它结合了弱学习(通常是决策树)来生成强学习。然而,开发高性能的Tree boosting模型是一个耗时的过程,需要大量的反复试验。作者为了解决这个问题,开发了一个可视化的诊断工具:BOOSTVis,以帮助专家快速分析和诊断树木生长的训练过程。界面如下图1:
Craster-18-paper_1-2
图1 BOOSTVis界面
        在可视化设计方面,作者为混淆矩阵设计的可视化视图(见图2)对于类似问题的解决也有着借鉴意义。
Craster-18-paper_2
图2 混淆矩阵视图说明

分享内容 #2:Towards Easy Comparison of Local Businesses Using Online Reviews
文献来源:Euro graphics Conference on Visualization (EuroVis) 2018
分享理由:
        本文主要目的是通过在线评论轻松比较本地企业,提出了一个交互式可视化系统,我觉得比较贴近生活,便于理解,也很有趣。

论文简介:

  1. 内容简介
            随着电子商务的快速发展,越来越多的在线评论网站,如Yelp,帮助客户做出更好的购买决策。查看在线评论,包括评级得分和其他客户的文本评论,以及进行不同业务之间的比较是做出最佳决策的关键。然而,由于大量的在线评论,用户评级标准的潜在差异,以及评论时间,长度,细节和质量的显著差异,客户很难实现快速和全面的比较。这篇论文中介绍了交互式可视化分析系统E-Comp,以帮助客户不同详细程度地比较本地企业。给出了四个视图,覆盖在地图上的直观字形设计用于初步比较快速选择候选;之后的三个图用于详细比较:Grouped Sankey图来显示共同客户的评级差异,以便更可靠地比较两个业务;还提出了显示形容词-名词词对的增强词云,结合时间视图,以便于在不同时间段,评级分数和特征方面对企业进行深入比较。
  2. 主要贡献
  • 提出了一个交互式可视化系统帮助客户对当地企业进行初步和详细比较。
  • 直观的字形设计,支持快速选择本地企业候选;新颖的增强词云,显示形容词-名词词对,以实现详细比较。
  • 案例研究和深入的用户访谈,以证明所提方法的有效性和可用性。
  1. 内容详解
            文章介绍的交互式可视化系统包括的视图主要有:覆盖有直观字形设计的地图视图(下图B,显示本地商家的基本属性)、共同客户比较视图(下图C,共同用户的评级差异)、时间视图(下图D,评级随时间变化的趋势)、增强词云视图(下图E,比较评论文本中一个特征维度的高频率形容词-名词词对)。(下图A是允许用户过滤数据和切换视图的控制面板、F是点击D中矩形或圆形显示的详细评论文本、F是选中区域内的企业列表)
    Craster-18-paper_3.png
    图3 系统界面
            作者在本文中详细介绍了这几种图是如何形成的,这个在我的论文研读中会细讲,不在此一一赘述。论文最后作者通过一个餐厅比较案例和深入的用户访谈来证明系统的有效性和可用性,通过这个过程我们可以知道这个系统使用的基本流程:
  • 从地图视图中查找具有较佳评级,价格,位置和受欢迎程度的感兴趣的本地企业
  • 通过共同客户比较视图查找共同客户评价评分的差异。
  • 通过时间试图比较所选企业的评论的时间趋势,包括总体评级和不同评级。
  • 通过增强词云视图在食物,服务,价格和氛围方面找出所选场地的差异。
  • 从高评价和低评价中探索客户喜欢或抱怨业务的主要原因