“一切问题都是心态问题,不要焦虑,只要踏踏实实做事,得到的回报和付出的努力会是一个长期的均值回归。”

人工智能学院计算机科学与技术专业2019级硕士研究生刘芷宁把良好的心态看作是取得成绩的重要保证。“要好好珍惜校园生活,大胆去尝试。”从刘芷宁身上,我们看到了充满朝气、蓬勃向上的青春模样。他曾连续两年获得硕士研究生国家奖学金,多次获得优秀研究生、优秀团干部、一等研究生优秀奖学金、社会奖学金等荣誉奖励。
“工程能力是科研能力的一部分”
“机器学习的领域应该还是蛮广泛的,有很大的价值,学好之后可以赋能很多实际的、跨学科的应用。”刘芷宁说,他的主要研究方向为通用不平衡学习与公平机器学习技术,在现实应用中保护机器学习系统所面向的少数群体,在包括智能物流、金融欺诈监测、智能医疗诊断在内的许多领域都有广泛应用。
刘芷宁认为,科研和实习是相辅相成、相互促进的关系。“尽量不要把科研和实习对立开来,尤其是对于我们计算机类这种工程性质比较强的学科,实习锻炼的工程能力本身就是科研能力的一种。”在刘芷宁看来,只要在实习的过程中可以得到锻炼、能力有所提升,都是值得的。大四的时候,他在微软亚洲研究院(MSRA)进行了为期九个月的实习。实习期间,刘芷宁基于现实物流应用场景,为大规模不平衡机器学习设计了高效的智能算法,提出了“自步集成学习”的概念以及动态平衡欠采样技术。所提出的技术最终应用于微软公司与顺丰速运共同开发的运单理赔预警服务中。该工作所形成的论文也随后以长文在数据库与数据挖掘顶级会议ICDE上发表并作口头报告。该工作的开源实现已被下载万余次,被使用者广泛应用于大数据竞赛、生物学、社会经济学研究等领域。
返回学校后,刘芷宁与来自新加坡南洋理工大学、澳大利亚悉尼科技大学的研究者一同继续进行相关研究。他介绍说,“我们在类别误差分布概念的基础上,构建了通用、高效、可迁移的元学习策略,通过学习自适应的元采样器及采样策略,大幅提升集成模型在不平衡数据上的分类性能。”该工作发表在计算机科学/泛人工智能领域的顶级会议NeurIPS上,这也是吉林大学第一次以第一作者单位身份在此类人工智能顶级会议上发表论文。
尽管总体的科研之路比较顺利,但刘芷宁也有过很多次被拒稿的经历。“在写代码、跑数据的时候,本来打算跑一晚上,结果第二天发现代码有个bug,跑了几分钟就报错了。”刘芷宁说虽然遇到问题很难受,但是不能顾影自怜,要想办法去解决问题。有的时候被拒稿或卡bug往往是因为“当局者迷”,因此不能把自己封闭起来,要和老师同学们去交流,找准存在的问题,把遇到的困境解决掉。
“沟通激发思维的碰撞和灵感的火花”

“这几年,我实现了从学术小白到热爱科研、从学习知识到创造知识、从与吉大同学交流到与全国网友对话、从视野范围在中国到放眼世界的转变。”刘芷宁积极寻找与外界沟通和交流的机会,他在知乎上分享自己的科研心得和感悟,创作技术博客,浏览量数十万次。“我当时写博客的初衷就是想和外界进行沟通,科研交流还是很重要的,和别人讨论才会有更多思维的碰撞和灵感的火花。”
作为开放科学精神的拥护者,也为了让更多非专业人士能够从人工智能技术中受益,刘芷宁开源了其研究项目的所有代码,并发起了数个流行的开源人工智能知识库。除机器学习的专业研究领域外,还涉及人工智能与量子计算、医疗保健等领域的交叉应用。截至目前,刘芷宁的开源软件库已被下载使用两万余次,他发起的项目在全球最大的开源社区Github获得了1300余收藏,位列全球4千多万Github用户中的前0.03%。他还作为志愿者参与了吉林大学未来科学论坛、国际信息抽取联合会议(SIGIR)等各类学术活动,同时也担任包括ACM SIGKDD在内的多个人工智能领域顶级期刊与会议的审稿人。
刘芷宁说,他的获得感不在于投中了多少篇论文或者做了多少个开源项目,而在于帮助了别人。“如果我写的文章有人点了收藏,或者在社交平台上进行了分享,我就感觉我的知识帮助到了一个素未谋面的人。有的时候,我也会收到别人感谢我的邮件,我就感觉我的知识对于人类社会的发展作出了一点微薄的贡献,很有满足感。”
刘芷宁时常以自己的经历鼓励身边的学弟学妹们,“年轻人就应该多见识见识,去实验室静一静,去实习单位待一待,去祖国的大好河山看一看。”他目光坚定,眼中仿佛装着星辰大海。