人機博弈

人機博弈

博弈是指某個個人或是組織,面對一定的環境條件,在一定的規則約束下,依靠所掌握的信息,從各自選擇的行為或是策略進行選擇並加以實施,並從各自取得相應結果或收益的過程。博弈論的基本概念包括:參與人、行為、信息、戰略、支付函數、結果、均衡。人機博弈就是人類和機器的一種比賽。

對博弈的理解


圍棋
圍棋
博弈,詞語解釋是局戲圍棋、賭博。現代數學中有博弈論,亦名“對策論”、“賽局理論”,屬應用數學的一個分支,表示在多決策主體之間行為具有相互作用時,各主體根據所掌握信息及對自身能力的認知,做出有利於自己的決策的一種行為理論。目前在生物學、經濟學、國際關係、計算機科學政治學、軍事戰略和其他很多學科都有廣泛的應用。博弈論主要研究公式化了的激勵結構間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。
生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上布一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們“出棋”著數中理性化、邏輯化的部分,並將其系統化為一門科學。換句話說,就是研究個體如何在錯綜複雜的相互影響中得出最合理的策略。事實上,博弈論正是衍生於古老的遊戲或曰博弈如象棋、撲克等。數學家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規律及變化。這可不是件容易的事情,以最簡單的二人對弈為例,稍想一下便知此中大有玄妙:若假設雙方都精確地記得自己和對手的每一步棋且都是最“理性”的棋手,甲齣子的時候,為了贏棋,得仔細考慮乙的想法,而乙齣子時也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當然也知道甲想到了他在想甲的想法…面對如許重重迷霧,博弈論怎樣著手分析解...

人機博弈的典型案例


塞穆爾的跳棋程序
格林布萊特設計的國際象棋程序
IBM公司研製的超級計算機“深藍”
圍棋大戰
圍棋大戰
谷歌人工智慧圍棋“阿爾法狗

人機博弈代表著啥?


幾十年來,古老的圍棋遊戲一直是計算機難以涉足的領域,它的細微精妙使得人工智慧在這方面遠遠落後於頂級的人類棋手。上一次,當全世界的注意力聚焦在一塊小小的棋盤上,是1997年。當年5月,IBM的計算機“深藍”打敗了國際象棋世界冠軍,很多人因此失落, 甚至產生了恐慌的情緒。但是,要知道,圍棋相對於象棋來說,其變數又是另一個數量級,圍棋棋盤橫豎各有19條線,共有361個落子點,雙方交替落子,這意味著圍棋總共可能有10^171(1後面有171個零)種可能性。而宇宙中的原子總數是10^80(1後面80個零),即使窮盡整個宇宙的物質也不能存下圍棋的所有可能性。這個來自中國的古老遊戲,被很多人視為“智力巔峰”——其勢萬變,計算機不可挑戰。
自從今年一月份,阿爾法狗登上《Nature》封面,其關注程度就已經引爆。我們來分析一下人類智慧代表李世石失敗的原因,這可能要從阿爾法狗的運算原理入手:余凱認為,AlphaGo的優勢可能在於其應用了蒙特卡羅演演算法(Monte Carlo treesearch),這是應用於某些決策過程的搜索演演算法。“這種演演算法的特點是只要時間足夠,它能窮盡所有對局的方案,讓機器人充分學習。它突破了人類極限,讓電腦不斷自我對決並提升。”圍棋的棋局中變數雖然大,但是最終還是有限的,而不是無窮大
象棋的複雜度
象棋的複雜度
圍棋的複雜度
圍棋的複雜度
另外,李世石接受採訪時說:“如果對手是人,我倒不會這麼費神地做準備,可是對手是機器,我必須設想我一個人孤單坐在那裡的情景。和機器下棋心理戰行不通,到頭來我只能調節自己的心理。”對於人機博弈來說,本質上的差異也是不能忽略的:機器相對於人類,它不會有意識,“心理”不會波動,不會產生緊張的情緒;“身體”不會產生疲倦,可以對有限演演算法進行無限次地訓練和計算。因此,對於“征服圍棋”這個帶有哲學色彩的命題來說,缺乏思想、道德感和哲學理念的阿爾法狗是難以真正實現的!!

贏了並不可怕


事實上面對人工智慧壓倒性的勝利並不可怕,在今後的人工智慧的運用中,我們必須要思考它對人類的真正價值。
對於人機大戰中,人類智慧連連失利的事實,人類朋友們緊張和恐懼的情緒再度升級。有網友發出感嘆:“一場圍棋人機大戰,人類被逼到了牆角。”“人機大戰,留給人類的時間還多嗎?”……種種說法,不禁讓科幻迷們聯想到科幻小說《三體》中外星人入侵地球前的“漫漫長夜”。但是我認為,阿爾法狗雖然具有類似人類的判斷力,在“千古無同局”、極端燒腦的圍棋比賽中碾壓了人類智慧,但是這種恐懼思想似乎有些過了頭。
一般我們認為促使人生爆發出能量的本源動力有三項:慾望、理智與激情。這三項東西正好可以從人類的進化鏈條中提煉出來。基於理智衍生出來的東西可以是推理和計算,基於慾望和激情衍生出來的東西則是想象力、理想等。那什麼是人工智慧呢?抽掉人的慾望和激情,再抽掉人的肉體限制並把剩下的理智力量無限放大,人工智慧主要發展只能理智這一維度,並主要通過深度學習驅動,依賴於計算能力和大量數據。因此,基於數據和深度學習的人工智慧更像是已知領域的專家,但並沒能力像馬克思那樣去憑空創造出一個體系。歸根結底,人工智慧現在還只能是一個機器,處於弱人工智慧的階段。人工智慧現在還不能完成自我的進化,現在深度學習的方法只是對已知的數據去重複,泛化它,其實解決的還是已經有的問題。人工智慧,即便下棋把人贏了,但能夠解決的問題還是非常有限的,只是取代重複性的腦力勞動。
DeepMind(AlphaGo的研究公司)創始人也表示:AlphaGo距離人腦水平仍然相當遙遠,可能還需要幾十年。在前天的賽前發布會上,谷歌董事長施密特表示,正是人類的努力才讓人工智慧有了現在的突破,輸贏都是人類的勝利。“阿爾法狗”作為來自人工智慧領域的使者,它更像一個火種照亮了未來科技的發展方向。面對腦海中勾勒出的科幻景象,我們沒有理由選擇拒絕。當有朝一日動畫片中的機器人暖男“大白”真實地走入每個人的生活時,那會是多麼有趣的一件事。
公眾對人工智慧的警示掩蓋了人工智慧帶來的幫助,人工智慧必須思考對人類的真正價值。這次比賽對於做深度學習和做演演算法,在整個歷史里會扛起更多的責任,在人類文明裡,機器會扮演越來越重要的作用,代表這樣的力量,人應該更多思考自己的意義。

人工智慧是否是威脅?


擔心人工智慧對人類有威脅?現在還不到時候,細分才能將人工智慧做到極致。
人工智慧是否對人類產生威脅的主要判斷標準是:要看機器是否有意識。如果設置軍用機器人的目標不僅是殺敵還要存在下去,他就有可能發現他的主人是他的障礙,並想方設法除掉這個對自己構成威脅的人。而目前的情況是,第一機器沒有目的,第二它們不夠聰明。
從另一個角度樂觀地來想,機器贏了其實是好事,如果機器開始假裝輸給你,那就可怕了。如果他故意扮演輸給你,用其他的意圖來隱藏自己,在我們眼皮子底下悄悄對人類構成威脅,那就真的是細思恐極了。相反,這種真實的展現,可以讓出自人類之手的人工智慧還能夠在我們的把握中。
人機博弈的圖片
人機博弈的圖片
但是,當下的人工智慧市場似乎並不容樂觀,最大的問題是市場細分做得不到位。“現在的人工智慧相當於人在兩三歲時的智力,它離人的預期實際差距是非常大的。因此,只有市場細分化,產品才能更加優化,用戶體驗才能做到極致。”在吳義堅的理想狀態下,“我們要力爭做到幼童擬腦機器人的行業第一。”
在行業風口來臨之前,小青瓜也顯然已經做好了準備。大部分創業都不是一帆風順的,要經受各種波折。深處新興行業,在初期要耐得住寂寞,吃得了苦,更要面對各種質疑和挑戰。