轮椅上的博士矣晓沅:9 年求学路,我从清华毕业了

Posted 机器学习算法与Python学习-公众号

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了轮椅上的博士矣晓沅:9 年求学路,我从清华毕业了相关的知识,希望对你有一定的参考价值。

点击 机器学习算法与Python学习选择加星标

精彩内容不迷路

「轮椅上的清华学子毕业了」,7 月初,这一话题登上微博热搜榜,主人公正是我们本次专访的嘉宾--矣晓沅。

在本次 IJCAI-SAIA YES 会上,矣晓沅做了题为《基于学习实例隐空间的文本风格转换》的分享,介绍了一个文本风格自动转换的新方法:

利用流 (flow) 模型,基于多个风格实例来构建更强的风格信号,以此增强转换后文本的风格准确性,并在风格以及内容两个指标上取得了更好的平衡。

这一方法适用于半监督训练,使得利用少量平行数据,进一步提升转换效果成为可能。

同时可以有效规避解耦复杂性对实验结果带来的负面影响,也实现了风格转换后,文本的内容保留度和风格准确度的一致性。

 不用微博、不想走红,把时间留给科研

矣晓沅 6 岁患类风湿性关节炎,11 岁被下病危通知单、从此与轮椅为伴,21 岁被清华大学计算机系录取为 2012 级本科生,在母亲的陪伴照料下,如今他在清华度过了 9 年求学时光,顺利完成了博士期间的学习。

微清华大学计算机系马少平教授在微博称赞他

凭实力考上清华,未受任何照顾,同样凭实力读的博士

我评审了他的博士论文,工作很赞

矣晓沅博士期间在清华大学 THUNLP Lab 求学,师从孙茂松老师,博士期间主要研究文本自动生成。

即使身体不便,矣晓沅的科研成果也颇为丰盛,在 AAAI、IJCAI、ACL、EMNLP 等顶级 NLP/AI 学术会议,以及 CCL、《中文信息学报》等国内重要期刊会议中,发表论文 10 余篇。

清华校长邱勇为矣晓沅拨穗并颁发证书

但网络的走红似乎并没有对矣晓沅的生活产生影响,在被问到「上微博热搜是什么感觉」时,矣晓沅坦言「我不用微博,没有看」。

实际上这并不是矣晓沅第一次拒绝社交网络的「走红机会」,博士期间为了专注科研,他曾多次拒绝文化类或娱乐性节目的邀请。对他而言,把时间留给科研才是最重要的。

 师从孙茂松,打造 AI 诗人九歌

人的智能包括诸多方面,如逻辑推理能力、语言智能。前者对应的活动如下围棋,在 AI 领域的应用可见 AlphaGo;语言智能则涉及到人类的创造性,文本生成就是其中的代表行为。

诗词爱好者、本科就经常写诗的矣晓沅,萌生了一个想法,机器能不能像人类一样具有自己的创造力,机器在文本创造性上的极限又是怎样的。这也成为他博士阶段的研究方向。

2017 年,在导师孙茂松教授的指导下,矣晓沅开发了 AI 中文诗歌写作系统「九歌」,用户只需输入句子、段落或关键字,即可自动生成绝句、藏头诗、律诗、词等不同体裁的诗歌。

九歌新版 3.0 系统将于 8 月 23 日上线

支持绝句、藏头诗、律诗、词等多种体裁的诗歌写作

访问九歌:

http://jiuge.thunlp.org/jueju.html

九歌采用了当时最新的深度学习技术,结合多个为诗歌生成专门设计的模型,基于 80 余万首古人诗作进行训练。同时九歌也支持多模态输入、多风格多体裁诗歌生成以及人机交互创作等功能。

虽然九歌在创作速度和数量上不受限制,偶尔也会生成一些很惊艳的作品。但在矣晓沅看来,好作品的出现可能是概率问题,九歌尚处于三流业余诗人的水平。绝大部分创作出的诗歌在篇章结构、前后呼应上,与人类创作的作品尚有差距。

矣晓沅认为,AI 与人类应该是相辅相成、共同促进、共同进步的。

输入「人工智能」九歌自动生成的七言绝句

以九歌为例,虽然时下是人类充当老师,用千百年来创作积淀的优秀文学作品,教导机器,但是随着技术进步、算法更新,机器创作的效果也会越来越好。

机器偶尔产生让人眼前一亮的作品,给人类创作者带来启发和灵感,激励人类创作者创作出更多更优秀的作品,这些作品又可用于提升模型性能。这是一个相互促进的关系。

 首篇论文 4 投 4 拒,审稿意见最宝贵

与众多博士生的求学路一样,矣晓沅博士期间的研究也并非一帆风顺。

在投稿第一篇论文的时候,曾连续 4 次被拒,直到第 5 次才被收录,这个过程持续了一年多将近两年的时间,矣晓沅坦言当时承受了极大的心理压力。

从小就饱经病痛折磨的矣晓沅,这次同样没有轻易言败,他愈挫愈勇、越是失败越想去再次挑战,最终在导师和实验室同学的协助下,矣晓沅博士期间的第一篇论文最终被 CoNLL 2018 收录。

矣晓沅博士期间首篇论文被 CoNLL 2018 收录

论文地址:https://arxiv.org/abs/1809.04313

事后矣晓沅在反思这件事的时候,坦言「不要怕论文被拒」,他觉得如果一篇论文被连拒多次,表示文章一定有很多明显的不足。这时要广泛反思吸纳审稿人的宝贵意见。

此外还要有自己的判断,如果一篇论文只是为了凑数而投的灌水文,那么不被收录也很正常。

但是如果对自己的工作非常有信心,那么不要因为多次被拒而迟疑灰心,根据审稿人的意见不断完善论文,再投就是了,不管论文能否被收录,都能有所收获。

 给学弟学妹:过来人的快问快答

大一入学时,由于基础薄弱矣晓沅的成绩在年级中仅仅排第 69 名,经过坚持不懈的努力,大二时他的成绩升至第 31 名,大三则达到了第 9 名,并在 2015 年获得了清华本科生特等奖学金(每年仅 10 名)。

但读博和本科是非常不一样的状态。本科遇到的问题和需要学习的课程,都有明确的路径。博士阶段则完全靠自己探索,有时候会迷失,有时候会看不到努力的结果。对此矣晓沅给出了一些过来人的「建议」。

 Q1:读博之前需要做好哪些准备?

科研并不像理想中那般潇洒和炫酷,现实中的科研过程往往会面临非常多困难,也会非常枯燥。

因此对于想要读博的学弟学妹们,推荐大家本科就去实验室实习,即使打杂也能体验到真实的科研过程。

读博会遇到各种各样的困难,比如想不出研究方向、论证方法,或者实验效果不理想、论文被拒等。要克服这些学术上的困难,就需要你对自己的研究方向保有深刻的热爱和强大的信念。

既然选择了科研,就要做好心理准备,学术回报更多是精神回报和社会认可,不一定是大富大贵。

 Q2:如何确定课题?

读尽可能多的论文,随时跟进行业最新技术。在选题时多思考、多和同学及导师沟通,分享自己的思路。

经验丰富的导师对大方向的判断非常敏锐,从思路上就能对你的选择给出比较可靠的判断。

 Q3:如何避免撞题?撞题了如何应对?

在选题或做实验之前,确保你要研究的课题符合以下两种情况之一:

1、别人都想不到,只有你能想到。一拍脑袋就有的想法大概率是别人也会想到的。

2、虽然大家都想到了,但是只有你有能力做出来。

万一出现撞题,可以先仔细研读撞题的论文,确认你想到的细节对方有没有想到,对方的研究方法是否有很多不足。如果答案是肯定的,则课题还可以继续提升。

 Q4:投稿时如何筛选顶会?

各个顶会都有自己的特点,要尽量根据不同顶会的喜好,灵活调整论文。

比如 ACL 比较注重分析、思路、效果,而 IJCAI 则比较综合,更多看中效果、方法,方法也要炫酷一些。投稿之前要先自行判断,然后再「投其所好」。

 Q5:读博最重要的品质是什么?

青年学者最重要的品质就是探索和坚持。

科研的本质是探索,探索就难免会失败,会短期内没成果。因此不要因为失败而气馁。

这也正是科研的乐趣所在:做很多新尝试,尝试很多新方法。不要因为这项研究前无古人,自己又没接触过,就畏惧它,读博一定要多尝试。

坚持对于写论文发论文也非常重要。在动手之前,一定要想清楚自己选择的方向,多多评估这项研究的意义以及实现方法。

即使期间遇到各种各样的困难、实验效果不好,也不要轻言放弃,因为效果不好可能是多方面的原因,要有针对性地逐个击破,最终一定能做出来。

 Q6:希望社会、家庭、学校给予青年学者哪些支持?

从社会角度来讲,希望给步入学术圈的年轻人更多的支持和理解。

他们投入了非常多的时间精力,但是一些基础学科如数学、物理,短期内不一定有成果,这个时候应该给他们更多的机会和时间。

从家庭的角度来讲,希望家人对青年学者多一些理解和包容,博士也不要为了做科研整年不回家。青年人和家人之间应该多沟通。

学校则应该在制度和经费上给青年学者更多支持。

 Q7:推荐哪些学习资源?

研读论文以访问 arXiv,关注行业最新的论文和研究动向;Google Scholar 也会根据个人的研究方向和兴趣自动推荐;还可以关注各个顶会的收录论文列表,根据研究方向或摘要筛选和阅读。

书籍阅读则推荐一些基础类书籍,如 Bengio的《DeepLearning》,中科院宗成庆老师的《统计自然语言处理》,邓力老师与清华 THUNLP 实验室刘洋老师合著的《基于深度学习的自然语言处理》等。

三本书都非常侧重基础知识

是夯实学科知识、了解最新研究的推荐书籍


觉得不错,请点个在看呀

以上是关于轮椅上的博士矣晓沅:9 年求学路,我从清华毕业了的主要内容,如果未能解决你的问题,请参考以下文章

邓亚萍:我是如何学英语的(一种学习方法)

清华2022就业报告出炉!本硕毕业生超33%首选IT大厂,博士一半留京

清华2022就业报告出炉!本硕毕业生超33%首选IT大厂,博士一半留京

他,1年9个月获清华博士学位,一作身份发27篇SCI,组队击败NASA打破“航天奥林匹克”欧美垄断...

博士五年,我在清华做时序数据库

清华大学2022就业报告出炉!