媒体扫描

读特 | 世界排名前2%科学家董超:用AI让数亿人拍出高清大片

发布时间:2022-07-25 来源:深圳先进技术研究院

 

[video:读特 董超]

 

  33岁的董超看上去更像一个文科生。 

  他喜欢画画,酷爱艺术设计,五岁起学习国画,后来带着团队一笔一画绘制出团队标志和科研蓝图。

  他还喜欢读书,读得多,读得杂,从小看人物传记、天文地理、科幻小说,还在办公室打造了读书角。

  但他最终走上理工科的道路。董超是中国科学院深圳先进技术研究院数字所副研究员、博士生导师。2014年,他在欧洲计算机视觉大会(ECCV)上发表论文SRCNN,首次将深度学习引入图像超分辨领域;2017年至今,他多次带队参加国际超分辨率比赛,已获得9项冠军;2016年至2018年,就职于商汤科技的他,带领超分团队开发了世界首款基于深度学习的数码变焦软件;2021年,他被斯坦福大学评选为世界前2%顶尖科学家;今年,他又入选2022年人工智能全球最具影响力学者榜单(AI 2000)。

  在董超的成长轨迹里,理性与感性交织,数字与美并存。

  获评AI领域顶级学者 

  “我没有提交任何的材料,我也是某一天看到了这个新闻才知道,跟你一样。”5月12日,董超在深圳先进院的办公室对读特记者说。

  董超所指的新闻,是今年4月公布的2022年人工智能全球最具影响力学者榜单(AI 2000)。这个榜单由清华大学计算机系AMiner团队联合智谱AI、清华—中国工程科技知识中心知识智能联合研究中心等共同发布,旨在通过学术数据,在全球范围内遴选过去十年,在人工智能学科最有影响力、最具活力的顶级学者。自2020年首次发布以来,每年约有200名AI领域学者入选。今年,董超榜上有名。

董超(左二)参与研发的视频超分辨率项目在NTIRE 2019挑战赛获奖。(受访者供图) 

  董超是深圳先进院数字所副研究员、博士生导师。他的研究领域集中在底层计算机视觉,主要包括图像和视频的超分辨率、去噪、增强、HDR等。2014年,他在欧洲计算机视觉大会(ECCV)上发表论文SRCNN(基于深度卷积网络的图像超分辨率),首次将深度学习引入图像超分辨领域。论文引起广泛关注,在谷歌学术论文搜索上的引用量已经超过1万次。

  2016年,博士毕业的董超带着研发成果进入深圳市商汤科技有限公司,带领团队开发出世界首款基于深度学习的数码变焦软件,“我们用手机拍照时使用的美颜功能,以及放大图像的功能,其实都是基于这个底层视觉的算法。”根据媒体资料,截至2021年9月,已有数亿款手机搭载了这一特别的影像功能。

  顶住压力一路坚持 

  “任何一个从0到1的发明都不容易。”在董超看来,把深度学习引入图像超分辨领域,最大的难度来自于人们对它的质疑,“包括我们自己”。

  这是一次对传统思维的突破。过去,深度学习在高层视觉获得巨大的应用成果,但它在底层视觉从来没有被应用过,“因为这两种应用的理念是相反的”。董超以人脸识别为例解释说,高层视觉的作用是最后识别出来这个人是谁,相当于提取一个抽象的符号;但在底层视觉,需要把图像变得更加清晰以获取所有像素信息,而不仅仅是提取某个符号。

  “我能够把深度学习应用到图像超分辨里面,并不完全是我一个人的努力。”董超介绍,2012年,国内有很多高校和研究所都在发展深度学习。当时,他在香港中文大学多媒体实验室攻读博士,导师敏锐地发现深度学习可能会给计算机视觉技术带去颠覆性改变,所以带领团队开始了对深度学习的全面研究,这也为后来将其引入图像超分辨领域打下基础。

  寻求突破并非易事。董超还记得,研究开始五个月之后,依然没有成功。当时,导师由于还有其他工作,不得不临时退出这个项目。在那之后的大概三个月里,董超独自继续研究,直到新导师的加入。“我的直觉认为它是可以成功的,不管付出多少代价,我都希望能把这件事情做成。这是我内心当中一种感性的坚持。”

  一年以后,论文成功发表,但董超没有就此停下,“现在我们还在持续做这件事情。最近这几年所取得的研究成果,比当时又进步了十几二十倍。”

  用感性做选择 

  董超是一个非典型理工科生,常常用理性来思考,用感性做选择。

  从上学时候起,董超就很擅长数学,参加过各种数学竞赛,也拿过不少奖项。在外人看来,他选择理工科是顺理成章的事情。但其实,这个选择还跟他的理想有关。

  董超喜欢读书和画画,大部分时间都沉浸在文化世界里。对他来说,“数学只是一种生存技能,文化才能带来幸福”。上小学时,董超读过一套人物传记。在读比尔·盖茨的故事时,董超常常眼睛发亮,“当时我就觉得计算机非常的酷。”对于爱因斯坦,董超则十分崇拜这位物理学家对科学的纯粹追求,“这种纯粹是我非常向往的。”从那以后,董超就将比尔·盖茨和爱因斯坦视为偶像,走上了成为“计算机科学家”的道路。

董超现在依然保持绘画的习惯。(受访者供图) 

  在这条路上,董超曾遇到很多岔路口。第一个重要选择发生在大一。董超本科就读于北京理工大学,由于当年高考分数不够没能被信息工程专业录取,不得不进入交通运输专业。一年学习下来,董超拿到专业的第一名,并连续两个学期获得一等奖学金。但他还是毅然决然地放弃了这个专业,“因为我知道这不是我想要的”,在大一结束时转入信息工程专业重回起点。

  类似的选择在董超就读博士时再次出现。2011年,董超被保送进北京理工大学信息工程专业下的雷达研究方向,学习了大半年后,他决定放弃这个博士学位。“我知道如果我持续做下去,我也可以做得很好,但这不是我内心所求,所以我再次做了一个新的选择。”

  董超开始申请香港中文大学信息工程专业的计算机研究方向。在学校的选择上,董超从一开始就目标明确,“我有巨大的热情在文科方面,所以我一定要在一所文理兼修的学校读博。”董超把所有筹码都压在一所学校的一位导师身上,他只寄出一份申请。一个月后,他拿到了录取通知书。

  在香港读博的四年里,董超依然面临很多选择,但他这回拒绝改变。“我非常确信这是我想要做的事情。我会把所有的精力投入到我最喜欢的事物上,破除一切外在障碍坚持下来,直到它成功。”

董超博士毕业照。(受访者供图) 

  走在成为科学家的路上 

  2016年,董超从香港中文大学毕业,回到内地继续从事研究工作。当时,他把落脚的地方选在了深圳,一是因为妻子在这里生活,二是因为看中了深圳的特质。

  在董超看来,深圳这座移民城市不仅开放包容,而且具有创业精神,大家可以平等地奋斗,追求梦想。“这是我来深圳的一个很重要的原因,事实也证明这个选择是对的。”

  在深圳,董超做出了人生中第三次重要的选择:从企业回到高校。他解释说,“我更希望成为像爱因斯坦那样纯粹的科学家。在高校里做研究,当老师,才是我真正想要做的事情。”2018年,董超离开商汤科技,进入深圳先进院。

  在学校里,董超带领着一个约有20人的团队,其中大部分是他的学生。董超给团队取名XPixel ,Pixel译为“像素”,X代表“未知”,意味着团队坚持探索未知,朝着更高的目标前进。对于带团队,董超把它比作经营花园,“最重要的不是考虑如何把一棵树栽培大,而是如何去培养土壤”。在董超看来,“土壤”代表的是一个团队的文化。一旦文化确定了,这个团队就有了明确的前进方向,成员们也将在文化的熏陶下蓬勃发展。

董超在办公室里存放书籍供学生借阅。墙上挂着他与团队成员共同绘制的作品。 

董超给作品取名《XPixel Metaverse》(XPixel 的虚拟世界),体现所有成员对科研的坚持,对艺术的追求,对生活的热爱和对世界的责任。(受访者供图) 

  董超将自己的团队文化概括为三个关键词:奉献、专注、平衡。

  在董超的团队里,“奉献”对应的英文是“love(爱)”。董超认为,“科研可以造福人类,也可以毁灭人类。科研人员的初心和动机决定了科研成果最终将被如何利用。”他希望,每一名学生都有科技向善的价值观,用科研造福人类。为了把“奉献”落到实处,董超经常带领学生做科普活动和公益项目,至今已经坚持了四年。

董超在给学生科普人工智能。(受访者供图) 

  董超还希望学生专注做事,平衡工作与生活。“我常跟学生讲,你们要做自己想做的事情,活出自己想活的人生。做一个幸福的人,才是我培养学生的终极目标。”同时,这也是董超的目标之一。

  董超的另一个目标是“成为一名祖国乃至人类需要的科学家”。“这是一个永无止境的过程。”董超说,因为科学家永远走在求真务实、探索未知的路上。


附件下载: