2021智源大会-day2

6月2日,2021北京智源大会第二天会议如期进行。小伙伴们根据参与情况与方向匹配程度筛选如下报告并加以报道。


图神经网络相关

报告题目:图神经网络的两面性:特性与问题
报告嘉宾:王啸,北京邮电大学助理教授
报告内容:
报告系统地梳理了当前图神经网络的基本特性,并探讨了由此引发的一系列问题。图神经网络具备良好的结构捕捉能力,具有低通滤波和消息传递的特性,但也由此产生了对节点的特征结构刻画不足、信息利用欠缺等问题。报告人介绍了他在特征结构刻画(AM-GCN,https://github.com/zhumeiqiBUPT/AM-GCN )、高频信息利用(FAGCN,https://arxiv.org/abs/2101.00797 )和图神经网络统一框架研究(GNN-LF,https://www.bilibili.com/video/BV1Fh411Q7x7 )方面的进展,为理解图神经网络带来新的视角,并尝试赋予图神经网络更强大与全面的表达能力。

图1 图神经网络的两面性总结

报告题目:考虑拓扑结构的图神经网络学习
报告嘉宾:林衍凯,腾讯微信模式识别中心高级研究员
报告内容:
近年来,图神经网络被广泛应用于节点分类、链接预测等各种图相关的任务 中,并取得了很不错的效果。报告介绍了考虑图拓扑结构的图神经网络学习,主要分析了以下三个问题:
1、如何从图拓扑结构的角度解释图神经网络的过平滑问题;
2、如何在图神经网络的对比学习过程中考虑图信息的拓扑分布;
3、如何在图神经网络的学习过程中考虑标注节点的拓扑分布不平衡问题。

图2 图神经网络中的分布不平衡问题

科研技能提升讲座

报告题目:如何撰写高质量科技论文
报告嘉宾:刘洋,清华大学计算机科学与技术系长聘教授,清华大学智能产业研究院副院长,国家杰出青年基金获得者,智源学者
报告内容:
学术论文是科研创新的重要载体。来自清华大学的刘洋教授以机器翻译领域为例介绍了学术论文的写作方法和技巧。在宏观层面上,报告介绍了论文的写作目标、评价体系、组织结构和基本原则。在微观层面上,报告讲述了句、段落、章节的写作方法、逻辑连贯、样例使用、可视化、常见英语写作错误以及论文写作的注意事项。最后,报告以顶会范文进行实例讲解,直观呈现了各类技巧的效果。

图3 撰写论文的主要思路

报告题目:审稿视角下的计算机视觉论文——从投稿到接收
报告嘉宾:施柏鑫,北京大学计算机系研究员
报告内容:
报告嘉宾以计算机视觉领域的顶级会议CVPR为例,详尽地介绍了计算机国际学术会议的投稿及审稿流程。并基于自身经历,从作者投稿之后着眼,分享了在审稿人和领域主席的视角下会议各个环节中的处理注意事项。

图4 论文审稿的基本流程

智能信息检索与挖掘论坛

报告题目:搜索:从相关性到有用性
报告嘉宾:文继荣,中国人民大学教授,智源首席科学家
报告内容:
本报告围绕搜索技术的发展方向,主要介绍了搜索结果可解释性、搜索过程多轮交互和搜索内容多模态。
讲者围绕可解释性,分析了目前基于因果的搜索引擎的局限性,并介绍了团队利用反事实学习等相关领域技术消除偏差的影响,进而实现因果推断的研究进展,并展示了团队在可解释性领域的其他研究成果。
讲者接着讲解了交互式搜索框架和目前的研究进展,包括面向语义融合的交互式信息获取、基于话题引导的交互式信息获取和基于认知模型的交互式搜索评价,并介绍了团队开发的基于对话的交互式信息获取工具。
在文本到多模态方面,讲者简单地介绍了文澜模型,使用数据说明了其在文检索图和图检索文等方面的优越性能,随后引出了使用图作为介质的机器翻译等未来研究方向。

图5 交互式个人智能信息助手的功能展望

报告题目:面向反馈回路和数据偏差的因果推荐系统
报告嘉宾:何向南,中国科学技术大学大数据学院教授
报告内容
在推荐系统中常常存在各种各样的偏差(Bias),这些偏差在推荐系统的反馈循环中可能被不断加剧,进而导致推荐系统生态恶化。针对上述问题,讲者在本报告中介绍了因果推荐系统。讲者首先介绍了反馈回路的定义和常见的推荐系统中偏差的来源。讲者指出,传统的推荐方法的缺陷在于,在不加干预的情况下,只会尝试拟合偏差,从而放大偏差。讲者总结了三种相关偏差,包括因果、混淆和碰撞,其中后两种偏差会造成伪相关。针对偏差问题,现有的解决方案有IPS(一种期望无偏估计器)和Causal Embedding。讲者还介绍了团队目前针对数据偏差问题的探索,包括:Auto Debias,自动优化超参数和模型参数;通过Pairwise data解耦用户点击背后的心理原因;通过改进因果图,消除系统中存在的流行度偏差;通过因果干预,利用流行度偏差等。最后,讲者总结认为,更细粒度的偏差检测、对话和交互推荐系统中的偏差检测和知识图谱偏差检测等领域是未来可能的研究方向。

图6 何向南教授总结报告内容,并对未来研究提出期望。

报告题目:基于多模态Embedding及检索的短视频内容理解技术
报告嘉宾:王仲远,快手技术副总裁
报告内容
快手平台日活量大,上传视频内容数量庞大、种类丰富,但随之产生了对内容进行深度理解并通过引擎定向推送给用户的挑战性需求。讲者针对将短视频转化成多模态Embedding中监督信号的定义问题,引出自监督学习与有监督学习结合的策略。针对平台特点,使用hashtag、搜索Query和用户评论三种群体智慧构建多模态Embedding模型,解决了定义监督信号的问题。随后讲者介绍了模型中各层的优化点,并引出模型使用的向量检索平台的特点。最后讲者介绍了多模态Embedding的应用场景,例如辅助进行视频创作、辅助优质视频获得流量、将内容理解与推荐整合,以及平台的未来规划,包括更大规模的模型、跨域内容理解Embedding等。

图7 王仲远副总裁介绍多模态Embedding的模型架构
123