沃森

超級電腦名稱

超級電腦“沃森”由IBM公司和美國德克薩斯大學歷時四年聯合打造,電腦存儲了海量的數據,而且擁有一套邏輯推理程序,可以推理出它認為最正確的答案。"沃森"(Watson)是為了紀念IBM創始人Thomas J. Watson而取的。IBM開發沃森旨在完成一項艱巨挑戰:建造一個能與人類回答問題能力匹敵的計算系統。這要求其具有足夠的速度、精確度和置信度,並且能使用人類的自然語言回答問題。這一系統沒有連接至網際網路,因此不會通過網路進行搜索,僅靠內存資料庫作答。

技術構造


沃森由90台IBM伺服器、360個計算機晶元驅動組成,是一個有10台普通冰箱那麼大的計算機系統。它擁有15TB的存儲容量、2880個處理器、每秒可進行80萬億次運算。這些伺服器採用Linux操作系統。IBM為沃森配置的處理器是Power 7系列處理器,這是當前RISC(精簡指令集計算機)架構中最強的處理器。它採用45nm工藝打造,擁有八個核心、32個線程,主頻最高可達4.1GHz,其二級緩存更是達到了32MB。存儲了大量圖書、新聞和電影劇本資料、辭海、文選和《世界圖書百科全書》(World Book Encyclopedia)等數百萬份資料。每當讀完問題的提示后,“沃森”就在不到三秒鐘的時間裡對自己的資料庫"挖地三尺",在長達2億頁的漫漫資料里展開搜索。
沃森是基於IBM "DeepQA"(深度開放域問答系統工程)技術開發的。作為“沃森”超級電腦基礎的DeepQA技術可以讀取數百萬頁文本數據,利用深度自然語言處理技術產生候選答案,根據諸多不同尺度評估那些問題。IBM研發團隊為“沃森”開發的100多套演演算法可以在3秒內解析問題,檢索數百萬條信息然後再篩選還原成“答案”輸出成人類語言。每一種演演算法都有其專門的功能。其中一種演演算法被稱為“嵌套分解”演演算法,它可以將線索分解成兩個不同的搜索功能。

研發背景


1997年,IBM研發的計算機“深藍”(Deep Blue)戰勝了國際象棋冠軍卡斯帕羅夫;2011年,這家公司以創始人Thomas J. Watson名字命名的計算機,繼續著對人類智能極限的挑戰。
在1960年代人工智慧的技術研發停滯不前數年後,科學家便發現如果以模擬人腦來定義人工智慧那將走入一條死胡同。“通過機器的學習、大規模資料庫、複雜的感測器和巧妙的演演算法,來完成分散的任務”成為人工智慧的新定義,這早已經取代了曾經甚囂塵上的“重建大腦”。
按照這個定義,沃森在人工智慧上被認為又邁出了一步。“深藍只是在做非常大規模的計算,它是人類數學能力的體現,”IBM中國研究院資深經理潘越告訴《第一財經周刊》,他同時參與沃森項目,負責提供數據支持。“當涉及到機器學習、大規模并行計算、語義處理等領域,沃森了不起的地方在於把這些技術整合在一個體系架構下來理解人類的自然語言。”

發展方向


此前,基於深藍研發的AIX操作系統讓IBM在商業運用與政府部門中取得了大量的訂單,IBM也希望可以將沃森的DeepQA系統運用於醫療服務、諮詢等領域之中。
“沃森的優勢是給出準確與可靠的答案,因此可以為醫生提供更適合病人的解決方案。”潘越稱,“在醫療領域的應用將是沃森商用最主要的領域。”之所以選擇醫療領域,是因為這裡具有良好的檔案儲存制度,積累了大量的醫學數據、病例檔案,並進行了科學的分類。這些大量的可搜索數據,是沃森發揮作用的重要前提。
沃森在醫療行業找到了自己的第一份工作。根據IBM和醫療保險公司Wellpoint的協議,從2012年年初開始,沃森將幫助護士們管理複雜的病例和來自醫療服務提供商的請求;然後,Wellpoint會開發出一套面向醫生的技術,使得醫生可以通過自己的手機和平板電腦,了解腫瘤患者的身體狀況。
不同地區醫療水平的巨大差異,也使得沃森擁有廣泛的應用前景。“一些偏遠地區的小醫院也可以通過雲端訪問全國的醫療資料庫,享受到沃森帶來的服務。”
沃森項目如果想在醫療行業推行的話,還需要面臨法律層面的問題,IBM一位研究員稱,“如果沃森診斷出錯,而醫生又聽從了錯誤的診斷,那麼沃森就會面臨被患者告上法庭的危險,這對IBM而言是一個正在考慮的應用問題。”
對於IBM來說,沃森未來不僅要繼續挑戰人類智能的極限,還要幫助這家公司去同亞馬遜谷歌微軟們競爭,爭奪未來科技制高點的主導權。
美國哥倫比亞大學醫療中心和馬里蘭大學醫學院已與IBM公司簽訂合同,兩所大學的醫療人員將利用沃森更快、更準確地診病、治病。它的海量信息庫中存有許多發表在期刊上的專業論文,可以讓醫生利用最新科研成果治療病人。
想要讓沃森真正成為醫生的得力助手,還需要對它進行改進。醫生需要的不只是一個答案。而且有時病人提供的信息不準確或相互矛盾,這就需要醫生利用豐富的經驗進行判斷。IBM研發小組接下來的挑戰是,讓沃森多提供一些假設情況,研發小組至少還需要兩年才能完成這一任務。

參與節目


沃森在美智力競猜節目中擊敗人類
參與節目
參與節目
北京時間2011年2月17日,人機大戰最終成績出爐:電腦沃森狂勝人類。由IBM和美國德克薩斯大學聯合研製的超級電腦“沃森”(Watson)在美國最受歡迎的智力競猜電視節目《危險邊緣》中擊敗該節目歷史上兩位最成功的選手肯-詹寧斯和布拉德-魯特,成為《危險邊緣》節目新的王者。
在第三天的比賽中,IBM的超級電腦沃森獲得了41413美元的分數,而兩位人類選手肯·詹寧斯(Ken Jennings)和布拉德·拉特(Brad Rutter)分別僅獲得了19200美元和11200美元。
將三個比賽日的成績相加即可得出最後的總成績,沃森也是大幅領先於人類,最終成績上,沃森達到了77147美元,肯·詹寧斯排名第二,但只獲得了24000美元,而布拉德·拉特獲得了21600美元,排名第三。
參與節目比賽
參與節目比賽
在第三比賽日的比賽中,沃森一路領先,以至於在進入最終的Final Jeopardy環節前,人類選手超過沃森的幾率已經幾乎不存在了。
在Final Jeopardy中,排名第二的肯·詹寧斯已經放棄追趕沃森,而選擇保住第二的位子,因此他僅賭了1000美元,排名第三的布拉德·拉特則放手一搏,壓上了他所能賭的最大賭注——5600美元,而沃森再一次暴露了他是非人類的本質,賭了17973美元,這和人類正常賭的整數大相徑庭。

不足之處


IBM超級電腦沃森無法分辨不當辭彙頻爆髒話
雖然“沃森”非常貪婪地接收了人們為它提供的所有知識,但是布朗發現,這個微型機“學生”很難理解人類交流中的微妙含義。它開始向人類研究人員頻頻爆出粗口的回應后,他們決定終止教授“沃森”俚語的嘗試。
布朗的科研組必須從“沃森”硬驅里刪除《城市字典》的內容,並研製一款語言過濾器,以防它再次爆粗口。這次失敗的試驗似乎支持了美國分析哲學家約翰-塞爾提出的雖然“沃森”具有驚人能力,但事實上它不會思考的觀點。根據他的“中文屋”思想實驗,塞爾認為“沃森”與其他電腦一樣,它只能處理文字元號,並不能真正理解它們的含義。