支付矩陣

支付矩陣

支付矩陣(Payoff table/ Payoff matrix)或稱報酬矩陣、收益矩陣、贏得矩陣、得益矩陣。是指在博弈論中,用來描述兩個人或多個參與人的策略和支付的矩陣。不同參與人的利潤或效用就是支付。支付矩陣(pay-offmatrix)包含備擇行動方案、自然狀態和損益值(或效用值)的矩陣。在實驗心理學信號檢測論中,指在一定的信號和噪音出現的先定概率條件下,對被試判斷結果的獎懲辦法。所有方案的集合A:a稱為行動空間或決策空間。各自然狀態出現的概率Pi建立在主觀觀測與經驗估算的基礎上,為主觀概率,。

基本內容


博弈論中,用來描述兩個人或多個參與人的策略和支付的矩陣。不同參與人的利潤或效用就是支付。
也稱“贏得矩陣”,是指從支付表中抽象出來由損益值組成的矩陣。
英文名為thepayoffmatrix。
在實驗心理學的信號檢測論中,指在一定的信號和噪音出現的先定概率條件下,對被試判斷結果的獎懲辦法。
支付矩陣(pay-offmatrix)包含備擇行動方案、自然狀態和損益值(或效用值)的矩陣。備擇行動方案(a1、a2、…、an)是滿足決策目標的n個可行的備擇方案。它們彼此獨立。所有方案的集合A:{a}稱為行動空間或決策空間。自然狀態(e1、e2、…、em)是各種行動方案可能遇到的狀態。它們往往是隨機的,可以用概率(P1、P2、…、Pm)表示。所有狀態的集合E:{e}稱為狀態空間。各自然狀態出現的概率Pi建立在主觀觀測與經驗估算的基礎上,為主觀概率,。所有概率及其狀態構成概率空間。對應於(ai,ej)的損益值(或支付值),是行動方案ai在自然狀態e,條件下所產生的收益值(正值)或損失值(負值),其集合為Q={q11、q12、…、Q1m、…、qn1、qn2、…,QNM}。效用值域為U={u11、…,unm}、其中uij=u(qij)。