首頁>資訊 >
清華姚班陳丹琦獲斯隆獎,與去年得主馬騰宇是同班同學,博士畢業(yè)論文是近十年最熱之一 2022-02-16 14:53:20  來源:36氪

清華姚班大神陳丹琦,剛剛有了最新榮譽。

斯隆研究獎得主。

斯隆研究獎,素來有“諾獎風向標”的稱號。

獲得這個獎項的研究者,將得到為期兩年75000美元的獎金。

此前,與陳丹琦同為姚班畢業(yè)生的鬲融、馬騰宇,都曾因獲此獎項而引發(fā)關注。

說回到陳丹琦本人,正是計算機科學領域近來最受關注的華人青年學者之一。

她是08級清華姚班校友,也是信息學競賽圈內(nèi)頗具傳奇色彩的一位女選手——CDQ分治算法就是以她的名字命名。2008年,她代表中國隊斬獲一枚IOI金牌。

而她那篇長達 156 頁的博士畢業(yè)論文《Neural Reading Comprehension and Beyond》,更是一度火爆出圈。

不光獲得當年斯坦福最佳博士論文獎,還成為了斯坦福大學近十年來最熱門畢業(yè)論文之一。

現(xiàn)在,她已前往普林斯頓大學從頭搭建NLP小組,成為該校計算機系的助理教授。

從零搭建NLP小組

此次獲獎的原因,正是基于陳丹琦在NLP領域的成就與潛力。

目前研究方向主要聚焦在兩方面。

一個是開發(fā)基本的方法來學習語言和知識表征,以及它們之間的相互作用。尤其是兩個問題:對人類知識(比如陳述性、常識性)如何從文本中獲得,以及智能系統(tǒng)如何表示、檢索、推理、使用這些知識。

另一個是建立實用的系統(tǒng),包括問題問答、信息提取和對話代理,尤其是如何將這些方法推廣到現(xiàn)實場景中去。

她的小組成員中,有一位也是清華畢業(yè)生,2019年清華特獎得主高天宇。

最新一篇研究,他也參與其中。

這篇研究提出了一種全新評估機制——基于預測歷史的問題重寫機制,該機制可以跟人類的判斷形成更好的關聯(lián),讓對話問答(CQA)效果更好。

來到普林斯頓大學之前,她曾是斯坦福大學的博士研究生,師從NLP大神Christopher Manning。

這可是位泰斗級別的人物,他是斯坦福NLP小組的創(chuàng)始人。

他寫的書籍《Foundations of Statistical Natural Language Processing》(統(tǒng)計自然語言處理)和《Introduction to Information Retrieval》(信息檢索導論),幾乎是每個NLPer的必讀入門書。

在Manning教授的指導和學習下,2014年她發(fā)表了一篇《A Fast and Accurate Dependency Parser using Neural Networks》,可以說是深度學習依存分析方法的“開山之作”。

他們的方法在保持精度的前提下,直接將解析速度提高了 60 倍。

而她在學術界的影響力還在繼續(xù),最典型的就是在博士畢業(yè)之際寫的那篇156頁論文,上線僅四天就獲得上千訪問量。

這篇論文主要聚焦于神經(jīng)閱讀理解,簡言之,就是構(gòu)建于深度神經(jīng)網(wǎng)絡之上的閱讀理解模型。包含了闡述原理構(gòu)建模型、以及結(jié)合現(xiàn)有成果構(gòu)建實際應用場景兩個部分。

去斯坦福拜入NLP泰斗門下,之后再去普林斯頓搭建NLP小組,回想這兩段經(jīng)歷,陳丹琦曾這樣解釋她做出選擇的原因。

陳丹琦告訴叉院學姐公眾號:

我選斯坦福的時候其實不太知道自己要做什么,是后來選了research group才定的方向。

去普林斯頓是因為我認為對我來說這是個機會,一個成長和承擔的機會。

因為普林之前沒有NLP,能在這邊能建立一個自己的group。

算法以她的名字命名

每次提到清華姚班,一定都少不了陳丹琦的名字。

事實上回顧她的整段經(jīng)歷,如今的成就少不了她自身的努力和周遭的支持。

她出生于湖南長沙,高中就讀于長沙市雅禮中學。

這所學校是信息學奧林匹克競賽強校,歷史上一共9名學生獲得過IOI(國際信息學奧林匹克競賽)金牌,比以“信息學競賽第一?!敝Q的紹興一中還要多一名。

而陳丹琦就是在2008年——高三的時候拿下了第20屆IOI金牌,也成為了湖南省首位金牌女選手。

并以此保送到清華姚班,與馬騰宇、余佳俊等成了同學。

據(jù)雅禮中學報道,陳丹琦的父親陳擎是國防科技大學數(shù)學系的副教授。

他在陳丹琦很小的時候就發(fā)現(xiàn)女兒對數(shù)字很敏感,且做題速度、思考問題的全面性都比同齡孩子厲害。

于是,父親就對她進行了有意識的培養(yǎng):她從三年級就開始練奧數(shù),初一參加全國數(shù)學聯(lián)賽就獲得了湖南賽區(qū)二等獎,初三獲得了特等獎,并開始接觸信息學。

奧賽圈耳熟能詳聞的“CDQ分治算法”就是這位學霸在集訓期間提出來的,并以她的名字命名。

還有著名的插頭DP,也是她在集訓隊時的成果。

基于這個工具,她還發(fā)表了篇論文《基于連通性狀態(tài)壓縮的動態(tài)規(guī)劃問題》。

據(jù)當時報道,在學習之余,她也很會放松自己,最愛看《名偵探柯南》,還練得了一手好行書。

也正是在這一段奧賽征程中,她遇到了自己未來的丈夫——俞華程。還在博士畢業(yè)論文中狠狠秀了一波恩愛。(手動狗頭)

嗯,就是下圖最右邊這位帥小伙。

陳丹琦在致謝部分表示,她從15歲(上高一時)就認識了他,從高中的競賽到清華的本科四年,再到一起去斯坦福讀計算機博士,最后在博士畢業(yè)前四個月結(jié)婚,俞華程一直都是他最好的朋友、最敬佩的人。

而俞華程本人,也很厲害,他在斯坦福大學讀博期間,因為發(fā)表多篇重要論文而提前2年畢了業(yè),隨后在哈佛大學做博士后研究,主要關于理論計算機,最后也成為了普林斯頓大學的助理教授。

除了這些經(jīng)歷之外,陳丹琦還不止一次呼吁女性也要更多參與到理工、計算機學科建設當中來。

她曾在“叉院學姐”采訪中表示:

不要刻意強調(diào)女生不擅長學工科、計算機這個事情。

男女之間的GAP會越來越不存在。

計算機領域還有多位華人獲獎

本次斯隆獎一共有118名來自化學、數(shù)學、物理、計算機等領域的科學家獲得。

其中,計算機領域一共頒給了20名全球科學家,其中包括5位華人,而華人獲獎者中,最多的是來自清華的校友,除了陳丹琦還有:

07級清華電子工程系本科、現(xiàn)CMU助理教授方飛。

她博士畢業(yè)于美國南加州大學,主要研究方向為博弈論和機器學習。

03級清華自動化專業(yè)本科、控制科學與工程專業(yè)碩士畢業(yè)生、現(xiàn)UCLA助理教授顧全全。

他的研究方向為統(tǒng)計機器學習,重點是開發(fā)和分析用于機器學習的非凸優(yōu)化算法,ICML 2021年他有8篇論文都被接收。

還有兩位華人獲獎者為:

港科大校友宋舒然,現(xiàn)哥倫比亞大學助理教授,主要研究計算機視覺與機器人技術。

以及現(xiàn)UIUC教授Li Bo,她的研究方向為機器學習及其安全、隱私和博弈論。

而在計算機科學方向之外,本次斯隆獎有6名華人學者獲數(shù)學獎,其中2名來自北大數(shù)院,另有3名獲物理獎。

參考鏈接:

[1]https://sloan.org/fellowships/2022-Fellows

[2]https://antkillerfarm.github.io/dl/2018/01/17/Deep_Learning_31.html#%E6%A6%82%E5%86%B5

[3]https://stacks.stanford.edu/file/druid:gd576xb1833/thesis-augmented.pdf

[4]https://www.emnlp2014.org/papers/pdf/EMNLP2014082.pdfhttps://arxiv.org/abs/2112.08812

[5]https://mp.weixin.qq.com/s/q_IkEt3NhwtJIkKDr6OhNA

本文來自微信公眾號“量子位”(ID:QbitAI),作者:楊凈 豐色,36氪經(jīng)授權發(fā)布。

關鍵詞: 畢業(yè)論文 同班同學

相關閱讀:
熱點
圖片 圖片