人機博弈

博弈是指某個個人或是組織，面對一定的環境條件，在一定的規則約束下，依靠所掌握的信息，從各自選擇的行為或是策略進行選擇並加以實施，並從各自取得相應結果或收益的過程。博弈論的基本概念包括：參與人、行為、信息、戰略、支付函數、結果、均衡。人機博弈就是人類和機器的一種比賽。

1對博弈的理解 2人機博弈的典型案例 3人機博弈代表著啥？

4贏了並不可怕 5人工智慧是否是威脅？

對博弈的理解

圍棋

博弈，詞語解釋是局戲、圍棋、賭博。現代數學中有博弈論，亦名“對策論”、“賽局理論”，屬應用數學的一個分支，表示在多決策主體之間行為具有相互作用時，各主體根據所掌握信息及對自身能力的認知，做出有利於自己的決策的一種行為理論。目前在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。博弈論主要研究公式化了的激勵結構間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。

生活中每個人如同棋手，其每一個行為如同在一張看不見的棋盤上布一個子，精明慎重的棋手們相互揣摩、相互牽制，人人爭贏，下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們“出棋”著數中理性化、邏輯化的部分，並將其系統化為一門科學。換句話說，就是研究個體如何在錯綜複雜的相互影響中得出最合理的策略。事實上，博弈論正是衍生於古老的遊戲或曰博弈如象棋、撲克等。數學家們將具體的問題抽象化，通過建立自完備的邏輯框架、體系研究其規律及變化。這可不是件容易的事情，以最簡單的二人對弈為例，稍想一下便知此中大有玄妙：若假設雙方都精確地記得自己和對手的每一步棋且都是最“理性”的棋手，甲齣子的時候，為了贏棋，得仔細考慮乙的想法，而乙齣子時也得考慮甲的想法，所以甲還得想到乙在想他的想法，乙當然也知道甲想到了他在想甲的想法…面對如許重重迷霧，博弈論怎樣著手分析解...

人機博弈的典型案例

塞穆爾的跳棋程序

格林布萊特設計的國際象棋程序

IBM公司研製的超級計算機“深藍”

圍棋大戰

谷歌人工智慧圍棋“阿爾法狗”

人機博弈代表著啥？

幾十年來，古老的圍棋遊戲一直是計算機難以涉足的領域，它的細微精妙使得人工智慧在這方面遠遠落後於頂級的人類棋手。上一次，當全世界的注意力聚焦在一塊小小的棋盤上，是1997年。當年5月，IBM的計算機“深藍”打敗了國際象棋世界冠軍，很多人因此失落, 甚至產生了恐慌的情緒。但是，要知道，圍棋相對於象棋來說，其變數又是另一個數量級，圍棋棋盤橫豎各有19條線，共有361個落子點，雙方交替落子，這意味著圍棋總共可能有10^171(1後面有171個零)種可能性。而宇宙中的原子總數是10^80(1後面80個零)，即使窮盡整個宇宙的物質也不能存下圍棋的所有可能性。這個來自中國的古老遊戲，被很多人視為“智力巔峰”——其勢萬變，計算機不可挑戰。

自從今年一月份，阿爾法狗登上《Nature》封面，其關注程度就已經引爆。我們來分析一下人類智慧代表李世石失敗的原因，這可能要從阿爾法狗的運算原理入手：余凱認為，AlphaGo的優勢可能在於其應用了蒙特卡羅演演算法（Monte Carlo treesearch），這是應用於某些決策過程的搜索演演算法。“這種演演算法的特點是只要時間足夠，它能窮盡所有對局的方案，讓機器人充分學習。它突破了人類極限，讓電腦不斷自我對決並提升。”圍棋的棋局中變數雖然大，但是最終還是有限的，而不是無窮大。

象棋的複雜度

圍棋的複雜度

另外，李世石接受採訪時說：“如果對手是人，我倒不會這麼費神地做準備，可是對手是機器，我必須設想我一個人孤單坐在那裡的情景。和機器下棋心理戰行不通，到頭來我只能調節自己的心理。”對於人機博弈來說，本質上的差異也是不能忽略的：機器相對於人類，它不會有意識，“心理”不會波動，不會產生緊張的情緒；“身體”不會產生疲倦，可以對有限演演算法進行無限次地訓練和計算。因此，對於“征服圍棋”這個帶有哲學色彩的命題來說，缺乏思想、道德感和哲學理念的阿爾法狗是難以真正實現的！！

贏了並不可怕

事實上面對人工智慧壓倒性的勝利並不可怕，在今後的人工智慧的運用中，我們必須要思考它對人類的真正價值。

對於人機大戰中，人類智慧連連失利的事實，人類朋友們緊張和恐懼的情緒再度升級。有網友發出感嘆：“一場圍棋人機大戰，人類被逼到了牆角。”“人機大戰，留給人類的時間還多嗎？”……種種說法，不禁讓科幻迷們聯想到科幻小說《三體》中外星人入侵地球前的“漫漫長夜”。但是我認為，阿爾法狗雖然具有類似人類的判斷力，在“千古無同局”、極端燒腦的圍棋比賽中碾壓了人類智慧，但是這種恐懼思想似乎有些過了頭。

一般我們認為促使人生爆發出能量的本源動力有三項：慾望、理智與激情。這三項東西正好可以從人類的進化鏈條中提煉出來。基於理智衍生出來的東西可以是推理和計算，基於慾望和激情衍生出來的東西則是想象力、理想等。那什麼是人工智慧呢？抽掉人的慾望和激情，再抽掉人的肉體限制並把剩下的理智力量無限放大，人工智慧主要發展只能理智這一維度，並主要通過深度學習驅動，依賴於計算能力和大量數據。因此，基於數據和深度學習的人工智慧更像是已知領域的專家，但並沒能力像馬克思那樣去憑空創造出一個體系。歸根結底，人工智慧現在還只能是一個機器，處於弱人工智慧的階段。人工智慧現在還不能完成自我的進化，現在深度學習的方法只是對已知的數據去重複，泛化它，其實解決的還是已經有的問題。人工智慧，即便下棋把人贏了，但能夠解決的問題還是非常有限的，只是取代重複性的腦力勞動。

而DeepMind(AlphaGo的研究公司)創始人也表示：AlphaGo距離人腦水平仍然相當遙遠，可能還需要幾十年。在前天的賽前發布會上，谷歌董事長施密特表示，正是人類的努力才讓人工智慧有了現在的突破，輸贏都是人類的勝利。“阿爾法狗”作為來自人工智慧領域的使者，它更像一個火種照亮了未來科技的發展方向。面對腦海中勾勒出的科幻景象，我們沒有理由選擇拒絕。當有朝一日動畫片中的機器人暖男“大白”真實地走入每個人的生活時，那會是多麼有趣的一件事。

公眾對人工智慧的警示掩蓋了人工智慧帶來的幫助，人工智慧必須思考對人類的真正價值。這次比賽對於做深度學習和做演演算法，在整個歷史里會扛起更多的責任，在人類文明裡，機器會扮演越來越重要的作用，代表這樣的力量，人應該更多思考自己的意義。

人工智慧是否是威脅？

擔心人工智慧對人類有威脅？現在還不到時候，細分才能將人工智慧做到極致。

人工智慧是否對人類產生威脅的主要判斷標準是：要看機器是否有意識。如果設置軍用機器人的目標不僅是殺敵還要存在下去，他就有可能發現他的主人是他的障礙，並想方設法除掉這個對自己構成威脅的人。而目前的情況是，第一機器沒有目的，第二它們不夠聰明。

從另一個角度樂觀地來想，機器贏了其實是好事，如果機器開始假裝輸給你，那就可怕了。如果他故意扮演輸給你，用其他的意圖來隱藏自己，在我們眼皮子底下悄悄對人類構成威脅，那就真的是細思恐極了。相反，這種真實的展現，可以讓出自人類之手的人工智慧還能夠在我們的把握中。

人機博弈的圖片

但是，當下的人工智慧市場似乎並不容樂觀，最大的問題是市場細分做得不到位。“現在的人工智慧相當於人在兩三歲時的智力，它離人的預期實際差距是非常大的。因此，只有市場細分化，產品才能更加優化，用戶體驗才能做到極致。”在吳義堅的理想狀態下，“我們要力爭做到幼童擬腦機器人的行業第一。”

在行業風口來臨之前，小青瓜也顯然已經做好了準備。大部分創業都不是一帆風順的，要經受各種波折。深處新興行業，在初期要耐得住寂寞，吃得了苦，更要面對各種質疑和挑戰。

人機博弈

人機博弈

對博弈的理解

人機博弈的典型案例

人機博弈代表著啥？

贏了並不可怕

人工智慧是否是威脅？

基本信息