效果律

效果律

效果律(law of effect)是指如果一個動作跟隨以情境中一個滿意的變化,那麼,在類似的情境中這個動作重複的可能性將增加,反之,如果跟隨的是一個不滿意的變化,那麼,這個行為重複的可能性將減少。這樣我們就能看到一個人當前行為的後果對決定他未來的行為起著關鍵的作用。“在刺激與反應之間形成可改變的聯結,給以滿意的後果,聯結就增強;給以不滿意的後果,聯結就減弱。”獎勵是影響學習的主要因素。獎勵就是感到愉快的或可能進行強化的物品、刺激或後果。在桑代克後來的著作中,他取消了效果律中消極的或令人煩惱的部分。因為他發現懲罰並不一定削弱聯結,其效果並非與獎勵相對立。

案例


桑代克注意到,為了保證學習的發生,除了貓必須處於飢餓狀態外,食物是必需的。“凡是在一定的情境內引起滿意之感的動作,就會和那一情境發生聯繫,其結果是當這種情境再現時,這一動作就會比以前更易於再現。反之,凡是在一定的情境內引起不適之感的動作,就會與那一情境發生分裂,其結果是當這種情境再現時,這一動作就會比以前更難於再現。”例如,要是貓逃出迷箱后得到的是懲罰而不是獎勵的話,那麼貓就不會再試圖跑出迷箱了。這就是桑代克著名的效果律。用桑代克自己的話來說:“滿意或不舒適的程度越高,刺激-反應聯結就越加強或越減弱”。

論著


在桑代克的早期論著中,效果律既包括正強化律,也包括負強化律。這種對稱性反映了歷來的傳統,即獎勵和懲罰都可以用來控制行為。但是,桑代克在1932年出版的《學習的基礎(FundamentalsofLearning)》一書中拋棄了懲罰律。這樣,效果律就不再是對稱的了,而是單向、正向一起作用的。桑代克說,是實驗的結果迫使他這樣做的。
在一項實驗中,主試緩慢地向被試念一連串單詞(約100個),這些單詞都是被試所熟悉的東西,如桌子、椅子、窗戶等。主試告訴被試,每個單詞都有一個對應的號碼,這要被試來猜。主試念一個單詞,被試猜一個號碼。主試對被試講出的號碼大多不給予反饋,只是偶爾說“對的”(強化)或“不對”(懲罰)。在念完所有單詞后,立即進行保持測驗,以了解被試剛剛猜測的每個單詞對應號碼的保持率。這顯然是一項枯燥乏味而又容易出錯的學習任務。結果表明,沒有得到任何反饋的單詞號碼,保持率為10%;得到強化(即主試說“對的”)的保持率為20%;受到懲罰(即主試說“不對”)的保持率為15~16%左右。這說明,強化和懲罰都有可能提高保持率。也就是說,受懲罰的反應並沒有減弱,而是加強了。桑代克由此拋棄了懲罰律。
在這項實驗中,桑代克還發現了“效果擴散(spreadofeffect)”的現象,即:獎勵不僅增加了受獎反應的重複率,而且還增加了鄰近反應的重複率。這種獎勵的效果呈一種梯度,即:離受獎反應越遠,受其影響越小。
桑代克由此認為,強化所具有的增強反應的力量——即聽到“對的”所產生的滿意效果——不僅影響受獎的刺激-反應聯結,而且呈梯度地影響鄰近的刺激-反應聯結。