厉害!他29岁,当985高校博导!
29岁当武大博导,他想培养更多的“雷军”!他是武汉大学计算机学院“90后”博导叶茫,一起来看看他的经历吧。
让计算机“看清”世界
叶茫出生于1991年9月,2009年考入武汉大学电子信息学院。大四时,他放弃了保研机会,考研进入计算机学院国家多媒体软件工程技术研究中心,“选择非常重要,只有真正喜欢的方向才能持续钻研。”
专业基础差是叶茫首先遭遇的难题。叶茫坦言,“刚进实验室那会,经常问导师很多‘愚蠢’的基础问题,曾经一度以为自己会被‘赶’出项目组。”“拖油瓶”的压力持续了一段时间,叶茫硕士期间投稿的第一篇论文投了多次都没有中。但导师鼓励他,“要想变得出众,就要比别人付出更多的汗水。”
在自身的热爱坚持和团队关心支持下,叶茫慢慢赶上。到2016年硕士毕业,叶茫已有4篇论文被多媒体顶级会议、期刊录用,也是当时实验室第一位以硕士身份发表CCF-A类论文的学生。
计算机视觉领域的学术初探,让他坚定了开展多媒体检索相关研究的决心,“如果算法变好了,视频检索出来结果就更准确,可以非常直观地感受到效果的变化。”
2016年,叶茫前往香港浸会大学攻读博士学位,继续扎进智能安防应用中视频图像检索领域。每天,他都是第一个到实验室,最后一个离开。虽然辛苦,但目标明确,叶茫也享受这种静下来慢慢做研究的感觉。
研究过程中,叶茫意识到,深度学习算法所依赖的大规模训练数据标注耗时费力,提出了新颖的“实例增广判别”的无监督特征学习思路,设计出一种快速的归一化实例增广特征优化学习方法,在大幅提升学习速度的同时,显著提高在细粒度图像检索任务中新测试类别的检索准确率。相关成果发表在人工智能顶级期刊TPAMI,计算机视觉顶级会议CVPR,得到了图灵奖获得者Geoffrey Hinton、Yann Lecun以及计算机视觉领域最有影响力学者何恺明等知名学者的引用和改进。
让计算机像人眼一样“看”世界,感知物体的大小、明暗、颜色、动静,从图像、视频中挖掘出有意义的信息并且理解和思考——这是叶茫所从事的计算机视觉研究关注的核心问题。
“真实世界是多样的,单纯利用图像或视频很难解决复杂的任务,我更关注图像、文本、视频、语音的结合分析应用,以此增强对多媒体内容认知和推理的能力,提升人工智能模型在多媒体分析应用中的通用性和安全性。”
叶茫举例说,如果要从监控视频中要找到一个犯罪嫌疑人,可以根据目击者的文本描述,利用文本和图像跨模态的匹配找到检索目标;如果找到的目标有些像了,还可以增加“胖一点、高一点”等文本修饰,就能进一步提升目标检索的准确性。
29岁回“珈”成为正教授
博士毕业后,叶茫又远赴阿联酋起源人工智能研究院担任研究科学家,进一步将成果深化和转化。“在武大汲取养分的7年,为我筑牢了学术的根基。浓厚的人文气息,任何一个地方都难以比拟,天人合一的美是武大独有的。”2020年12月,叶茫参加武汉大学国际交叉学科论坛后,收到了母校的邀约,他决定带着最新成果回到珞珈山。
当时只有29岁的叶茫,已是复杂受限场景下的多媒体检索领域佼佼者,以第一/通讯作者发表CCF-A类论文20余篇,包括TPAMI、CVPR、ICCV等,6篇ESI高被引,7篇第一作者文章谷歌学术引用过百,总引用2600余次。
武汉大学唯才是举,鉴于叶茫优秀的学术表现,提前按照海外优青标准给他相应待遇——直接聘任教授四级岗位、授予博导资格,连续4年保证1-2个博士生招收指标,并给他提供了充足的科研经费。在计算机学院、国家多媒体工程技术研究中心、湖北珞珈实验室和人工智能研究院等平台的叠加支持下,叶茫快速开展科研工作、建立科研团队,并取得了多方面的学术收获。
叶茫在CCF-A类人工智能顶级期刊TPAMI再次发表论文,主持国家自然科学基金面上项目、湖北省重点研发计划等众多项目,入选中国科协青年人才托举工程。2021年年底,30岁的他又成功申报了青年海归人才翘首以盼的科研资助——国家自然科学基金优秀青年基金(海外),进一步加速开展创新性研究。
想培养更多雷军一样的人才
入职后的9个月,叶茫正式迎来了自己第一批研究生。叶茫认为,“需要根据不同的特点做针对性的调整,因材施教还蛮有挑战的,但是整体而言,他们都非常刻苦努力。我有个私心,想在武大培养像雷军一样优秀的人。”
为了培养更多“雷军”,叶茫不仅注重培养学生的学术能力,鼓励学生进行灵活的组会汇报,钻研有深度有新意的课题,为学生提供更好的交流讨论和学习的机会,还非常重视学生的创新能力培养,支持学生参加高质量的国际比赛。
在2021年10月落幕的计算机视觉顶级会议ICCV 2021多模态视频理解大赛中,叶茫带领团队学生陈朔怡、李贺和王同鑫在无人机特定目标检索赛道夺得了冠军。“现在做比赛跟我当年完全不一样了,得益于学校充足的启动经费,在硬件条件上有很大的提升,打比赛更加得心应手。”叶茫说。
同时,让学生在产业一线锤炼本领也是叶茫内心的坚持,因为计算机领域的研究成果“绝不能养在深闺”。他带领学生与海信集团合作开展了图像文本相关性技术开发与研究,助力文本图像跨模态理解在智能家居领域的应用;与华为公司合作提升视频图像检索技术在城市安防中的应用;与绿盟科技合作开展了隐私保护的联邦学习研究……
“今年30岁,我还可以在珞珈山奋斗30年。30年很长,除了在学术上继续努力,我最想做的事就是带好我的学生,特别是让我的每个学生都能热爱祖国、热爱武大!”叶茫坚定地说。