时间 : 2020年12月17日 09: 00
地点 : 望江校区基础教学楼B座318实验室
研读成员 : 李长林,朱佳旻
研读内容 :
Part1
分享者:李长林
分享内容:
[1]Hohman F, Wongsuphasawat K, Kery M B, et al. Understanding and Visualizing Data Iteration in Machine Learning[C]//Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems. 2020: 1-13.
[2]Ming Y, Qu H, Bertini E. Rulematrix: Visualizing and understanding classifiers with rules[J]. IEEE transactions on visualization and computer graphics, 2018, 25(1): 342-352.
论文简介:
[1]成功的机器学习(ML)应用需要建模和底层数据的迭代。而先前ML的可视化工具主要关注建模。本文对23个机器学习实践者的采访表明,他们通过迭代数据(例如,收集新数据,添加标签)而不是迭代模型来提高模型性能。同时本文确定了常见的数据迭代类型以及相关的分析任务和挑战。为了帮助属性数据迭代到模型性能。本文设计了一组交互可视化,并将它们集成到原型中。CHAMELEON,允许用户在不同的数据版本之间比较数据特性、培训/测试划分和性能。本文提供了两个案例研究,其中开发人员将CHAMELEON应用到生产机器学习项目上不断发展的数据集。本文的界面帮助他们验证数据收集工作。发现跨数据版本的故障案例,捕获影响性能的数据处理更改,并确定未来数据迭代的机会。
[2]随着机器学习技术的广泛应用,使得机器学习系统更加透明和可解释性的研究热潮日益高涨。已经开发了各种可视化来帮助模型开发人员理解。诊断和完善机器学习模型。然而,大量潜在但被忽视的用户是对机器学习知之甚少的领域专家,他们被期望与机器学习系统一起工作。本文提出了一种交互式可视化技术,以帮助缺乏机器学习专业知识的用户理解、探索和验证预测模型。通过将模型视为黑盒,从其输入-输出行为中提取出一个标准化的基于规则的知识表示。设计了RuleMatrix,一种基于矩阵的规则可视化,以帮助用户导航和验证规则和黑箱模型。本文通过两个用例和一个可用性研究来评估RuleMatrix的有效性。
Part1
分享者:朱佳旻
分享内容:
[1]F. Beck, M. Burch, S. Diehl和D. Weiskopf, 《A Taxonomy and Survey of Dynamic Graph Visualization: A Taxonomy and Survey of Dynamic Graph Visualization》, Computer Graphics Forum, 卷 36, 期 1, 页 133–159, 1月 2017, doi: 10/f9wkd9.
[2] Pycon China2020会议分享
论文简介:
[1]动态图可视化专注于用可读、可伸缩和有效的图表来表示实体之间的关系演化。本文调查了该学科中逐年增多的方法。通过对出版物进行系统地分类和标记,我们得出了技术的分层分类法。 静态图的可视化通常分为节点链接表示和矩阵表示,而本文认为时间表示方法是动态图可视化的主要区别特征,我们将这些方法分为基于动画的方法和基于时间轴的方法。基于动画的方法的评估重点在于动态稳定性,即能否保留观看者的心理地图,也有方法将动画图与基于时间轴的图进行综合比较。文献分析为该领域及其社区的组织和发展提出了新的见解。最后,我们讨论并确定了未来研究的挑战。我们还提供了专家反馈,用问卷调查的方式,开拓了关于当下挑战和领域现状的视野。
[2] 「PyCon China(中国 Python 开发者大会)」作为 Python 语言社群的全国技术盛会,是由 PyCon 官方授权 CPyUG(华蠎用户组),PSF(Python 基金会)支持,并由全国各地 Python 爱好者共同举办的非盈利技术大会。本届大会于11月28日-29日在北京、上海和深圳以及线上举办,主要议题包括AI、Python开发调试技巧、网络安全、编译原理、协程与类型提示以及大数据和分布式平台等。