大学上半场:从一张图片到蛋白质
韩鹏远,男,汉族,共青团团员,成都信息工程大学新葡萄电子信息科学与技术2020级4班学生。现任寝室长,特种智能机器人实验室视觉组负责人。
让时间回到2020年9月20号,这是他第一次真正意义上的远离家乡,孤身一人来到了一座完全陌生的城市,但他很幸运遇见了一群可爱的人。他加入了特种智能机器人实验室,结合高中时期的兴趣,他选择了计算机视觉方向。当他第一次使用程序打开一张图片,并对它做相应操作时,他是异常兴奋的。从此,他的大学生活便以一张图片作为起点开始了。好奇心驱使着他从这一个点不断向外扩张:在互联网和图书馆的双重加持下,大一的第一个学期,他从数字图像的基本操作开始到机器学习中的一些经典分类器再到深度学习分类任务结束,他建立了三个点,以原理和应用为导向。从此,便在此基础上疯狂向外扩张。
第一个寒假,他做的最多的两件事:阅读论文以及复现。他读了几篇关于卷积神经网络的经典论文。第一篇是卷积神经网络的开山之作《ImageNet Classification with convolutional Neural Networks》并使用PaddlePaddle深度学习框架完成了论文复现,第一次读文章、第一次复现,虽然花费了他很多时间,但是,当他的程序正常运行并得到正确结果时,他是异常激动的。之后,他仍然保持着阅读论文和复现的习惯。因为,从别人的研究思路、别人的思考中总是能够收获很多。
大一的第二个学期,整个学期以及整个暑假他都沉浸在一个节奏中:比赛、读论文和复现. 阅读论文以获取知识和经验,并期待从中能够获得启发,比赛作为练习,希望能够加深理解并能实现。从智能汽车竞赛的红绿灯检测、车道线分割开始到软件设计竞赛的行人检测、行人跟踪,先导杯的小目标检测,嵌入式芯片与系统设计竞赛的模型部署最后到“一带一路”大数据竞赛的基于车载影响的视觉环境环境感知,这个过程中他收获了很多很多。
在接下来整个大二一年的学习生活中,他仍然保持了这样一种节奏,在不同比赛的推动下探索AI应用更多的可能性,并促使他持续不断向前:中国机器人大赛、48H coding party活动、亚太地区数学建模竞赛、五一数学建模竞赛、统计数学建模竞赛、中国大学生计算机设计竞赛、国际自主智能机器人竞赛、智能汽车竞赛、嵌入式芯片与系统设计竞赛、全国大学生机器人竞赛RoboMaster机甲大师、全国大学生数学建模竞赛等。
在探索不同学科、不同领域的这个过程中,它真正地提升了他的工程能力;它真正地教会了他要善于洞察事情的本质,要善于从不同角度看待、分析、理解和解决问题;它真正地使他有了开放、包容、理解的科学心态;科学与技术的关系在这个过程中才真正地在他的脑海里有一个初步印象。
当然,在这个过程中,在他的认知上,必然存在一些改变,在他的心底发出了这样一种声音:Going Deeper。赶巧的是,这时候他刚好看到了由中国计算机学会举办的2021CCF大数据与计算智能大赛。2021年9月底至11月底,他全身心地投入到了这件事情上,阅读论文并进行复现。做实验,修改,做实验,修改,做实验,修改。就是在这样反反复复的过程中,他最终在与来自全国院校、企业以及研究院的3455支队伍的PK中获得了第11名。
这件事情至此还没有完。也许是因为一种情结,或者说是他自己的某种偏见:他特别的希望这个模型能够胜任一切。所以,他希望他的模型里没有任何的技巧!
所以紧接着,赶上了他大学的第二个寒假,他觉得他当时那个骨骼点细粒度动作识别的模型不够称心如意。于是,他就借着这个寒假,基于最初的一个想法(比赛中没实现):细粒度动作之间的差别很小,有的动作甚至是在某几帧上的差别,因此他觉得解决这个问题的关键是模型能够区分出这么几帧,并且为其附上较大的权重。于是他想到了注意力机制,那么接下来问题又来了,这个注意力从哪来?紧接着他就想到了基于空间上的拓扑结构。因此就改,改,改,实验,实验,实验。他记得很清楚,在2022春节的那一天,他得到了一个积极地实验结果。于是又在后续的时间里继续实验完善验证过程,他的第一篇SCI论文便这样横空出世,2022年8月这篇论文在Applied Sciences期刊上正式发表。
大二的寒假之前,偶然间的一个巧合,他看到了施一公院士,在一次大会上的做了一个关于AI+生命科学的一个演讲。在施一公院士的演讲中中,也许是因为激起了童年时期的一些种种想法,在此唤醒了他对蛋白质这样小小的东西的兴趣。
从那时起,他便开始关注了AI+生命科学与医学领域的发展。很巧合的是,偶然间他看到了清华大学智能产业研究院院长张亚勤院士的一个演讲,从他的演讲中,他得知了他们要联合创新工场举办DeeCamp2022人工智能训练营暨创新挑战赛,主题为AI+生命科学。毫不犹豫,他立刻找到了DeeCamp的官网,投了他的简历,报了名。
他很幸运,加入了DeeCamp2022,成为了DeeCamp2022 150余名营员中的一员。
2022年6月底到8月底,他和生物学、医学相关领域的一名硕士研究生、三名博士研究生一起听大师课、阅读文献、开组会等等,共同挑战赛题:蛋白质结构预测酶活性。幸运的是,之前的学习和比赛内容虽与蛋白质好不相干,但又很多东西能类比应用到蛋白质编码表示中去。因此,他有幸成为了他们队伍中代码编写和模型架构设计的主力。最后,更幸运的是:他们以初赛第一的成绩成为6支进入总决赛的队伍之一。他也很幸运,作为为数不多的本科营员并能挺近决赛,获得了组委会颁发的DeeCamp2022特别奖之最佳科学探索奖。
至此,他的大学上半场,便从一张图片开始到以与蛋白质的浪漫邂逅结束。但他认为,这些仅仅只是一个开端。在接下来的日子里,他将会继续不留余力地探索更多可能。