黃學東

微軟全球人工智慧首席技術官

黃學東,IEEE/ACM院士(IEEE/ACM Fellow) ,微軟首位華人“全球技術院士”、微軟首席語音科學家、微軟雲計算與人工智慧事業部認知服務團隊全球技術院士/全球人工智慧首席技術官。他先後獲得湖南大學學士學位,清華大學碩士學位和英國愛丁堡大學博士學位。

人物經歷


黃學東
黃學東
黃學東曾就讀湖南大學計算機專業、清華大學念碩士、英國的愛丁堡大學博士學位。
1993年,他作為高級研究員加入了微軟研究所並負責組建Microsoft's語音識別技術研究團隊。
2000年到2004年,他作為Microsoft's語音識別技術研究團隊的總經理,負責微軟語音技術和產品的研究、開發和市場拓展。他領導微軟語音技術的開發和產品的市場行銷,包括獲獎的Speech Server 2004。在加入微軟之前,他在卡內基·梅隆大學致力於發展CMU's Sphinx-II語音識別系統。
2020年1月,黃學東出任微軟全球人工智慧首席技術官,全面負責微軟Azure雲、人工智慧(AI)的工作,包括語音、機器翻譯、計算機視覺、自然語言和人工智慧認知服務。

主要成就


在期刊和會議上發表了一百多篇論文,併合著出版了兩本非常有影響的專著即:Hidden Markov Models for Speech Recognition (Edinburgh University Press 1990)(語音識別中的隱含馬爾可夫模型(愛丁堡大學出版社1990))和Spoken Language Processing (Prentice Hall 2001)(口語處理(普林斯頓出版社2001))。曾獲中國教育部的科技進步獎、IEEE資訊理論文獎、Allen Newell傑出研究獎章,及SpeechTek的語言領域十大領軍人物稱號。
2015年以來,黃學東領導著微軟在美國、中國、德國、埃及、以色列的團隊研發包含語音識別及合成,微軟企業人工智慧客服對話解決方案、cris.ai以及luis.ai等認知服務、CNTK開源深度學習工具等人工智慧產品和技術。
2017年,黃學東被評選為微軟技術院士(Technical Fellow),這代表著微軟技術人員的最高榮譽,獲得這一榮譽的人還包括圖靈獎得主Butler W Lampson、Charles P. Thacker等。黃學東也是微軟首位華人技術院士。同時,他也是國際電子電氣工程師學會(IEEE)和美國計算機學會(ACM)的雙科院士,微軟認知工具包CNTK的締造者之一。
在黃學東的帶領下,微軟人工智慧團隊取得了多項里程碑式的技術突破,最新創造的成就如下:
2017年8月,在黃學東的帶領下,其團隊在產業標準Switchboard語音識別基準測試中實現了對話語音識別詞錯率(word error rate,簡稱WER),低至5.1%,創造了當時該領域內錯誤率最低紀錄,首次達成與專業速記員持平而優於絕大多數人的表現。
2018年3月份,黃學東帶領的團隊在機器翻譯領域拿下一項里程碑式的成就:其研發的機器翻譯系統在通用新聞報道的newstest2017中譯英測試集上,達到了人工翻譯水平。這是首個在新聞報道的翻譯質量和準確率上媲美人工翻譯的翻譯系統。
2019年,在斯坦福對話式問答任務中,微軟機器閱讀理解系統刷新記錄,成為目前排行榜上唯一一個模型分數超過人類分數的團隊。
2019年11月,微軟推出了基於深度神經網路語音合成技術的聲音定製服務(Custom Neural Voice)平台,將高質量的語音合成引擎開放給第三方,使得微軟合作夥伴和客戶可以通過簡單的自助服務定製有標識度和個性化的聲音。
2020年,在計算機視覺看圖說話任務中,微軟計算機視覺圖形傳字幕(image captioning)系統刷新記錄,成為在此研究任務上全球首個超過人類分數的團隊。