电信骄子-性能超越Mask R-CNN,黄钊金的科研之路
近期,公司2017级硕士研究生黄钊金作为第一作者完成的研究Mask Scoring R-CNN,在COCO图像实例分割任务上超越了大神何恺明(ICCV 2017最佳论文奖)的Mask R-CNN,拿下了计算机视觉顶级会议CVPR 2019的口头报告。也就是说,他从5000多篇投稿中脱颖而出,成为最顶尖的5.6%。
黄钊金本科就读华科一竞技官网卓越计划实验班,期间获得两次国家励志奖学金,一次国家奖学金,校三好员工,成绩年级为前5%,顺利保研一竞技官网,师从王兴刚副教授。并在此期间以第一作者身份发表一篇计算机视觉顶级会议论文CVPR,获得口头报告(Oral, 接受率5.6%),以主要负责人身份参加国际知名计算机视觉比赛COCO 2018 Object Detection Task,并获得第三名。
他在大三时对计算机视觉产生了浓厚的兴趣,并进入王兴刚老师实验室学习。当时进实验室开始做的方向是目标检测,而他也一直坚持到了现在。
在其所完成的CVPR2019的文章“Mask Scoring R-CNN"中,他提出了一种对物体mask打分的方法,并发现在实例分割现有框架Mask R-CNN中,物体的mask的得分直接来自于物体的分类得分,这个得分并没有考虑到物体的mask的质量, 于是就会出现有些物体mask质量很差但是得分很高的问题,这个问题对mask检测精度带来影响很大,而他的文章就是要解决这个问题。他的文章要给物体的mask打分,这个打分既要考虑到物体的分类得分也要考虑到物体mask的质量。他注意到评判mask好坏的标准是这个mask和真实mask的IoU, 于是就在现在框架的基础上再拉一个分支学习这个IoU, 为了方便起见,他不再去学一个mask的分类得分,而是直接用物体的分类得分,然后将分类得分和学习到的IoU相乘,将这个得分作为mask的得分,最后可以显著提高mask检测的精度。同时实验表明,尽管他单独拉了一个分支学习IoU,整个预测流程花费的时间和现有框架Mask R-CNN花费的时间几乎一样。所以他的方法简单有效,很容易嵌入到现有框架中,并且不会增加太多时间开销。
平常黄钊金喜欢看书,看电影,跑步,游泳,也会和同学一起打游戏看动漫看剧是一位暖男。周末时候喜欢去图书馆看书学习,他觉得在图书馆学习是一件很舒服的事。