8月6日,视觉计算实验室2020年度暑期内训第一阶段的Part5-9部分继续如期进行。参会本次内训的有:实验室负责人朱敏教授;2018级闫建荣;2019级李龙兴、明章强、李季倬、姚林、张铭洋;2020级温啸林、刘尚松、李长林、王心翌、张馨艺、杨勇;2021级拟接收研究生陈富秋、高雯雯、王凤杰、周怡。内训使用钉钉会议,采用线上线下相结合的方式。
Part5 什么是科研成果(温啸林)
该部分主要目的是帮助大家了解科研成果的形式,以及成果积累与呈现的过程。主要内容包括:什么是知识产权?什么是学术论文?什么是发明专利?什么是软件著作权?如何合理积累、呈现科研成果? 以下是部分内容摘要:
1. 什么是科研成果
讲者首先对知识产权的概念、分类及其特点进行了简要阐述。然后针对实验室的科研成果,对知识产权中的软件著作权、发明专利以及学术论文进行了详细阐述,包括三者的定义、申请流程、需要提交的材料以及申请周期等。
2. 如何积累呈现科研成果
讲者首先罗列了实验室科研成果的可能的三个来源:(1) 本科毕设,其中原型系统可以转化成软件著作权、系统中的方法创新可以转化为发明专利、研究的学术价值可以转化为学术论文;(2) 实验室项目,一般实验室的项目都会设定一个项目预期目标,比如产出几篇论文、几个专利等等;(3) 课程设计与专业竞赛,课设和竞赛一般都有明确研究方向和目标,可在此基础上进行创新和提炼。
然后,以本科毕设成果转化为例,阐述了如何将本科毕设转化为软件著作权、发明专利以及学术论文:
(1)软件著作权:软件著作权对于系统水平没有要求,主要是做一个备案登记。软著申请的撰写与本科毕设论文的区别在于要求具体的功能的说明。
(2)发明专利:发明专利的申请不同于软著是一个系统,发明专利的申请可以从系统抽取出方法,选择其中主要视图、关注重点作为申请的内容。
(3)学术论文转化:针对学位论文撰写时存在的问题,要将学位论文转化成学术论文,要需要从研究现状、参考文献的补充、案例分析等方面对论文进行优化和修改,要求重点关注学术创新、方法有效性评估方面等。
3. 实验室资源
针对实验室提供的资源,讲者从以下三个方面进行了介绍:
(1)经费支持:知识产权相关费用全部有实验室承担;
(2)实验室知识产权负责人职责:涵盖与专利代理的沟通、知识产权相关事务的办理、知识产权的资料管理、专利与软著的申请指导等四个方面;
(3)实验室已有资源:包括已授权发明专利、软著以及学位论文等。
此外,实验室负责人朱敏教授就研究生申请学位应取得的学术成果要求进行了补充,包括适用条件、申请学位论文答辩的条件等。
Part6 文档规范与周月报要求(明章强 )
该部分的主要目的是帮助大家了解并掌握文档撰写的基本规范,以及工作记录的具体要求。用月报实例,从内容、逻辑性、格式规范性、学术用词等方面, 对专业文档的撰写规范进行讲解,帮助掌握实验室对周月报的撰写要求,以及进行论文研读笔记、会议记录的基本方法等 。以下是部分内容摘要:
1. 文档类型
在该部分内容中,讲者对日常大家撰写文档的场景进行了简要介绍,包括课堂记录、学术讲座、组会、周报月报以及其他竞赛活动项目申报等。
2. 笔记撰写
讲者首先对日常交流的笔记给出了自己的建议,主要包括以下三点:(1) 人员信息,比如讲者身份及研究领域;(2) 关键词,比如关键技术或方法、研究术语等;(3) 重点结论,比如领域知识/技术方法/经验教训的总结。
然后以川大重点研发项目为例,对项目会议记录的方法进行了介绍。每次项目会议记录都要包括会议的基本信息、会议内容(工作汇报、会议确定和待确定内容等)、下阶段计划等几点,从而方便把握工作进度、合理安排时间。
3. 周月报要求
撰写周报月报是为了便于我们追溯自己的工作、记录论文/项目体会、培养专业撰写能力。
在周月报撰写的规范要求上,要求提交时间不得晚于当月最后一天晚上12点(特殊情况需事先告知推迟提交的原因)、以学位论文为撰写模版、注意内容中的人称表述、减少口语化的描述、自行预浏览检查排版/文字等错误;在周月的内容要求上,需要包括自己当月的计划完成情况、客观全面的记录(总结分析/反馈对比)、以及详细的下月计划。如图1所示。
最后,讲者以自己的月报为例,讲述了月报撰写过程中的注意事项。
最后,实验室负责人朱敏教授从文字表达规范性、经验总结、上月计划完成情况具体说明、下月计划粒度分解等方面对月报撰写进行了补充。
Part7 论坛、会议、暑校的学习方法(姚林)
该部分内容目的在于指导研究生体会如何高效地参加论坛或会议、寻找同方向的学术社群、撰写新闻报道和分享。此外,对实验室外出学习的要求进行说明,以华人计算生物大会、AI-生物工程论坛、南大CHI暑校等为例,介绍专业兴趣的寻找、重点的梳理记录、在实验室传播等。
1. 在外学习要求
在该部分内容中,讲者介绍了实验室支持的外出交流项目,包括学术会议、暑期学校、专业比赛、访问学习等四个方面。此外,将外出学习分为三个阶段,去之前、现场学习以及回来后,分别讲述了每个阶段的注意事项:
(1)去之前:向实验室负责人写申请、做好预算规划表;
(2)现场学习:做好记录,并每日在实验室官网发布当天学习记录;
(3)回来后:完成实验室分享以及决算表。
2. 在讲座中寻找学术关联
讲者以第三届世界华人计算生物学大会为例,讲述了在学术讲座过程中如何获取所有讲座的安排信息、如何筛选场次(筛选与研究方向契合的场次)、针对交叉学科如何筛选讲者所在的学院(不同学院讲者的研究讲述内容侧重点不同)、如何通过学术讲座加强自己与学者的学术联系(查找讲者的学术背景/保留会场微信群、与讲者交流自己的研究思路/与听众互加微信)。
3. 做好重点梳理和记录
针对外出学习过程的记录问题,讲者提出了以下几点经验:
(1)忠实地记录:包括屏、录音、拍照、笔记等,以便回顾;
(2)抓住重点进行记录:画图、表格或者以提问与回答的形式进行记录,提高记录的效率;
(3)记录逻辑:把内容按叙述的框架填充进去,比如背景引入-研究现状-研究内容-展望;
(4)将平铺的内容做好层次抽象:提炼主题;用提炼的主题,去寻找主干句子;
(5)抓住讲者简单的过渡句子:做好分段。
4. 暑期学校后的分享传播
在该部分内容中,讲者以南大人机交互暑期学校为例,对暑期学校结束后的实验室分享给出了自己的建议,包括以下几个方面:
(1)对有明显内容差别的内容分开论述;
(2)相比新闻稿,可用更生动的案例;
(3)多问几个what、why、how;
(4)以人为本,PPT的内容安排要考虑页码、层次、要点等方面;
(5)PPT的制作要求图文并茂,可以词组代替文段。
补充:通过向自己提问来体会本次分享内容
(1)姚林在今天分享的时候应用到了他提到的那些技巧和要点?
(2)如果让你来分享一次暑校,或举办这个part7、传授经验,你会怎么安排展示的结构?
Part8 ChinaVis2020挑战赛分享(温啸林)
该部分内容主讲今年带领团队参加数据可视分析挑战赛并获得优秀奖,故本场内训邀请讲者对挑战赛相关内容进行分享,主要包括挑战赛介绍、赛题理解与分析、赛题解决方案、团队组建与合作,旨在帮助新同学了解专业竞赛、如何选择并有准备地参加专业竞赛。以下是部分内容摘要:
1. 挑战赛介绍
中国可视化与可视分析大会 (ChinaVis) 是国内顶级可视化会议,其中数据可视分析挑战赛是该大会的一个重要环节。挑战赛历年会给出两个赛题,邀请相关研究人员、开发人员和爱好者使用他们最有效的可视分析技术和工具来完成数据分析任务,但2020年只有新冠肺炎疫情可视分析这一个赛题。
2. 赛题理解与分析
2020年挑战赛的赛题共包含六个主题,讲者逐一分析了他们团队的选题依据,最后因为社交媒体公开的舆情数据容易获取、当前关于疫情预测与舆情监测的研究中可创新的点多、团队成员在社交媒体话题与情感动态演变可视分析方面有论文研读基础且新想法多等因素,选取了“疫情预测与舆情监测”这个主题参赛。
3. 赛题解决方案
针对“疫情预测与舆情监测”这个主题,讲者从数据获取、可视化任务、可视化设计三个方面给出了他们的解决方案,最终实现了一个基于微博数据的疫情演化可视分析系统。
4. 团队组建与合作
讲者在该部分总结了关于团队组建与合作的一些要点。
(1)团队组建:讲者通过实验室组会了解到有小伙伴想参加挑战赛,会后就通过微信聊天确定了参赛人员和队长。
(2)团队合作:讲者从会议记录、任务提醒、沟通交流、合作氛围四个方面给出了自己的思考。
5. 分享心得
最后,讲者从获奖作品、赛题解决、参赛心得三个方面做了总结。
(1)获奖作品:学术论文实现的作品通常使用简洁清晰的白色背景,注重学术价值;挑战赛获奖作品通常使用具有高级感的深色背景,注重实用和美观。
(2)赛题解决:设计视图要严格针对每一个问题,尽量能解决题目中所有的需求;最终呈现的作品虽然可以使用多个视图解决问题,但获奖作品都为完整的可视分析系统。
(3)参赛心得:比赛能驱动学习,技术会突飞猛进;比赛能加强同级间交流和跨年级交流;团队成员分工明确、各司其职很重要;碰到问题时要积极向高年级学长学习;队长要掌控整个比赛流程,控场能力很重要。
Part9 生信领域的论文阅读与撰写(闫建荣)
本场内训由2018级闫建荣主讲,她的主要研究方向属于生物信息学领域。生物信息学领域(简称“生信”)主要围绕DNA、RNA、蛋白质这三个大分子展开研究。计算机专业的学生不需要深入研究它们在生物上的关联,只需要具备生物的基础知识,然后用算法来解决它们之间的问题即可。生物中的很多概念不懂也没关系,只需要简单了解,知道怎么对它们进行分析,知道在某一个过程用某一种技术就行。研究基因调控的各个过程,有助于了解生物活动,解码生命,是很有意义的事情。
讲者重点围绕实验室在生信领域的主要研究方向、生信领域的研究挑战与机遇、如何选择交叉学科的学术论文、生信领域的英文论文撰写与投稿等内容展开,旨在让不确定具体研究方向的同学了解生物信息领域的主要研究方向、该领域的论文来源,以及研究工作的开展、论文撰写与投稿等内容。以下是部分内容摘要:
1. 了解生物信息学领域方向
(1)主要研究方向:如RNA、DNA、蛋白质序列分析,RNA、DNA、蛋白质结构分析,蛋白质表达分析,基因表达分析等,这些方向下还细分了很多小方向。
(2)实验室相关研究:如基因表达数据分析关键技术研究、药物与不良反应相关性预测方法的研究、染色质拓扑关联结构域边界预测问题研究、RNA与蛋白质结合位点研究、增强子-启动子相互作用预测研究、miRNA靶位点预测研究、染色质环的预测研究等。
(3)难点与突破点:讲者表示这几年所做的生信都是一个套路,即拿到数据之前,要通过聚类、随机森林等机器学习的方法,在数据中寻找尽可能多的相关特征;然后使用神经网络等算法处理数据,产生中间结果;最后关联前面提取出的特征,来分析这些中间结果,进行花式验证,阐述生物学意义。
2. 如何选择交叉学科的学术论文
最常用的办法是使用一些关键字搜索论文,可以在谷歌学术、Nature、Science、Elsevier、百度学术上搜索,也可以跟踪其他实验室如清华大学交叉信息研究院等的研究。
(1)生物信息学领域期刊:Nature reviews genetics、Nature biotechnology、Nucleic Acids Research、Bioinformatics、Briefings in Bioinformatics、BMC Bioinformatics、BMC Genetics、BMC Genomics等。
(2)计算机顶会:关注人工智能、自然语言处理、视觉方面的顶刊,如IJCAI、AAAI、ACL、CVPR等,要多看CVPR上面的文章,会有很多思想碰撞。
(3)其他交叉学科信息获取渠道:在中国大学MOOC上学习生物信息学相关课程、在网易云课堂入门深度学习,并通过阅读书籍慢慢融入研究领域。此外,还可以关注学术头条公众号、大牛微博,以及小木虫平台获取研究动态。
3. 英文文章撰写与投稿
(1)英文文献撰写要点须知:大部分期刊整体上都包括四大部分,即Introduction、methods、result、conclusion,每一部分都很重要。整体的框架打好后,要多看别人的论文,看论文中的每一段每一句如何书写,才能实现内容的渐进引入、保证逻辑的正确性。写作过程中还要注意语法、标点、投稿杂志格式、图表与参考文献格式的正确性。
(2)如何选择合适的投稿期刊:从所阅读的期刊中查找;由实验室小伙伴推荐;自我评估文章水平,从影响因子表中筛选适合自己文章水平的影响因子范围内的期刊;通过会议转投期刊,如BIBM、TCBB等。进入期刊或会议主页可查询投稿、格式等要求。
4. 总结
讲者认为首先应该确定自己的研究方向,然后从期刊中下载与研究方向相关的论文进行文献调研,再选择合适的算法进行研究,接着就完成实验和文章的写作,最后选择合适的投稿期刊。她强调做研究要多看论文,充实自己的研究工作、增加研究底气。
最后,讲者对参训同学的问题进行了解答,姚林对生信领域所要求的能力进行了补充。
(1)实验室相关研究具体用到哪一类机器学习的算法:前期神经网络还没有普及,所以多通过构建网络、使用粒子群算法来解决问题,后期的研究则多采用机器学习和深度学习的方法。讲者建议对生信感兴趣的同学,选择在实验室研究的基础上开展自己的研究,以免经历从0到1的诸多困难。
(2)实验室相关研究的创新点如何体现:现在做生信的人比较少,多看计算机的论文,借鉴别人的算法,然后把它用在生信领域。即模型新、结果高、验证该模型能用即可。
(3)有一篇被华西医学期刊返回来的文章,要怎么把它投出去:投论文之前要了解一下你要投稿的期刊一般收录哪些内容的文章,以Oxford Bioinformatics为例,该期刊的首页会给出收录文章的主题。如果要投的文章属于它收录的主题范围内,就用关键字在该期刊的主页里搜索相关的文章,仔细阅读这些文章之后,再判断要投的文章是否符合该期刊收录的要求,若不符合,就另找期刊。
(4)姚林补充:实验室在做生信相关的论文研读时,一般都会弱化文章的生物背景,然后尽力用计算机的角度来解释相关工作,是能听进去的,不要觉得听不懂就不听;该领域对迁移能力要求高,如一维的字母串可以用自然语言的处理方式来做迁移处理,二维的矩阵型数据可以用图像处理如卷积网络的形式来处理,如果大家觉得自己的迁移能力较高,且愿意研究生信领域,就比较适合生信这个方向。
到此为止,实验室2020年度暑期内训的第一阶段就全部结束了。第二阶段的内训计划敬请关注网站和群通知。