视觉计算实验室CCF-A类会议投稿经验分享会

为营造良好学术科研氛围,提高整体科研水平,实验室将于2023年3月31日(本周五)上午9:30,在四川大学科技创新中心“黄大年茶思屋”进行CCF-A类会议投稿经验分享。此次分享会主题将涵盖CCF-A类会议的投稿准备、写作技巧、论文结构、实验设计和论文修改等方面,欢迎各年级小伙伴参与旁听。

分享主题:CCF-A类会议投稿经验分享

主讲人:廖俊华、温啸林

分享时间:2023年3月31日(本周五)上午9:30

地点:四川大学科技创新中心“黄大年茶思屋”

主讲人简介:廖俊华,2020级直博生,博士党支部支部委员,跟随陈良银教授从事视频自动剪辑方面的研究。目前已发表EI/SCI论文5篇,其中包括CCF-A类会议两篇(CVPR,MM)。曾任HPCC 2022(CCF-C类会议)、MMSP 2022审稿人,并受邀成为ICASSP 2023(CCF-B类会议)审稿人。2021年,获得四川大学华为奖学金一等奖、优秀研究生;2022年,获得四川大学博士研究生一等学业奖学金、四川大学博士生创新奖学金、优秀共产党员、优秀研究生、优秀研究生干部、石牛堰社区优秀志愿者。

论文信息:A Light Weight Model for Active Speaker Detection,CVPR2023。在视听场景中,主动说话人检测是一项具有挑战性的任务,其目的是检测谁在一人或多人场景中正在说话。这项任务在许多应用中都至关重要从而备受关注。现有的研究试图通过输入多个候选人的信息和设计复杂的模型来提高性能。尽管这些方法已经取得了优异的性能,但它们的高内存需求和庞大计算量使其难以应用于资源有限的场景。因此,在本研究中,通过减少输入候选人的数量,拆分2D和3D卷积进行视听特征提取,并应用计算复杂度较低的GRU进行跨模态建模,构建了一种轻量级的主动说话人检测框架。在AVA-ActiveSpeaker数据集上的实验结果表明,所提出的框架实现了有竞争力的mAP性能(94.1% vs. 94.2%),同时资源成本显著低于最先进的方法,特别是在模型参数(1.0M vs. 22.5M,约23倍)和FLOPs(0.6G vs. 2.6G,约4倍)方面。此外,所提出的框架在Columbia数据集上也表现良好,从而证明具有良好的鲁棒性。该论文已在2023年CVPR会议发表。

主讲人简介: 温啸林,2020级硕士研究生。2020年获得四川大学计算机和金融双学士学位,毕业后保研至四川大学计算机学院视觉计算实验室攻读硕士学位,研究方向为信息可视化与可视分析。硕士期间,曾作为科研助理前往南方科技大学和新加坡管理大学进行交流访学,硕士毕业后拟去新加坡管理大学攻读博士学位。目前已以第一作者身份发表学术论文4篇(包含两篇CCF-A类会议论文),合作发表SCI论文4篇,已申请发明专利4项,软件著作权1项。在读期间,曾获得四川大学腾讯奖学金一等奖、中国数据可视化挑战赛优秀奖、优秀研究生等奖项。

论文信息:NFTDisk: Visual Detection of Wash Trading in NFT Markets,CHI2023。随着NFT这一新型数字资产的日益盛行,NFT市场中也随之出现了大量的欺诈活动,其中,清洗交易是NFT市场中最常见的欺诈行为之一,表现为一组串通的区块链地址在内部频繁交易NFT来创造虚假的交易量和价格,从而误导投资者。由于清洗交易模式复杂,目前自动化算法仅能检测到一部分清洗交易活动,且存在较高的误报率。另一方面,投资者也很难从自动化算法的结果中得到足够的有效信息以支持投资决策,还需要借助人工检查原始的NFT交易记录来进一步确认清洗交易的特征、模式及影响。然而,目前领域内还没有针对NFT市场中清洗交易检测的有效分析工具。为此,本文提出了NFTDisk,这是一种新颖的交互式可视化方法,用于投资者识别NFT市场中的清洗交易活动,其中提供了两个联动的可视化模块:一个基于磁盘隐喻的径向可视化模块,用于概述NFT交易,另一个基于流隐喻的可视化模块,用于揭示多个级别的详细NFT流动情况。最后,本文对14名NFT投资者进行了两次案例研究和深入的用户访谈以评估NFTDisk。研究结果表明,NFTDisk在探索NFT市场中的清洗交易活动方面是有效的。该论文已在2023年CHI会议发表。