心理聲學

心理聲學

心理聲學(psychoacoustics)是研究聲音和它引起的聽覺之間關係的一門邊緣學科。心理聲學一詞似乎很令人費解,其實很簡單,它就是指“人腦解釋聲音的方式”。壓縮音頻的所有形式都是用功能強大的演演算法將我們聽不到的音頻信息去掉。例如,如果我扯著嗓子喊一聲,同時輕輕地踏一下腳,您就會聽到我的喊聲,但可能聽不到我踏腳的聲音。通過去掉踏腳聲,就會減少信息量,減小文件的大小,但聽起來卻沒有區別。

原理


心理聲學模型是對人聽感的統計性質的數學表述模型,它解釋人各種聽感的生理原理。
心理聲學模型可以在主觀聽感劣化不多的條件下,大大降低數字音頻信號傳輸的帶寬。它主要基於人的聽覺器官的生理結構和感知模式,通過對數字音頻信號的相應處理,去除不可聞的信號成分及引入不可聞的畸變,達到普通熵編碼無法達到的壓縮比率。
由於人耳聽覺系統複雜,人類迄今為止對它的機理和聽覺特性的某些問題總是還不能從生理解剖角度完全解釋清楚。所以,對人耳聽覺特性的研究僅限於在心理聲學和語言聲學內進行。人耳對不同強度和不同頻率聲音的一定聽覺範圍稱為聲域。在人耳的聲域範圍內,聲音聽覺心理的主觀感受主要有響度、音高、音色等特徵和掩蔽效應、高頻定位等特性。其中響度、音度、音色可以在主觀上用來描述具有振幅、頻率和相位三個物理是的任何複雜的聲音,故又稱為聲音“三要素”;而對於多種音源場合的人的耳掩蔽效應等特性尤為重要,它是心理聲學的基礎。
研究聲音和它引起的聽覺之間關係的一門邊緣學科。它既是聲學的一個分支,也是心理物理學的一個分支。心理聲學本可包括言語和音樂這樣一些複合聲和它們的知覺。這些可見語言聲學、音樂聲學等條,本條只限於較基礎和簡單的心理聲學現象,即①剛剛能引起聽覺的聲音──聽閾;②聲音的強度、頻率、頻譜和時長這些參量所決定的聲音的主觀屬性──響度、音調、音色和音長;③某些和複合聲音有關的特殊的心理聲學效應──餘音、掩蔽、非線性雙耳效應
與心理聲學對應的光學分支是光度學與色度學,它們分別科學地描述了人類視覺中對光強度與顏色的主觀感知。

分類


聽閾分強度閾和差閾。聲音不夠一定強度不能引起聽覺。在多次作用中能有50%的次數引起聽覺的最小聲壓級稱為強度閾(也稱聽閾)。聽閾有個體差異,因而所謂正常聽閾只能是一些聽力正常的年輕人的聽閾的統計平均值。聽閾隨頻率而變化。500~4000Hz之間閾值最低,在它們之上和之下的高頻聲和低頻聲的閾值都較高,如20Hz純音的閾值比1000Hz純音的閾值約高70dB,10000Hz純音的閾值也比 1000Hz純音的閾值約高10dB。最敏感的頻率是3000Hz左右,空氣分子振動的振幅達到10-11m 就可以聽到,這隻有氫氣分子的直徑的十分之一。聽閾隨年齡而增高,特別是高頻部分,表現為老年聾,如70歲的老人,5000Hz純音的聽閾約增高45dB。聽閾的概念還包括差閾,即兩個聲音引起聽覺差別的最小可覺差。就頻率說,在63Hz左右有經驗的人耳能區別相差0.5Hz的兩個純音的差別,但這種閾值在1000Hz要增加到1.4Hz,頻率越高差閾越大。人耳能區別的強度差值最小0.25dB(1000~4000Hz,70dB以上),強度低或頻率更高或更低時,強度差閾更大。在整個聽覺範圍內,可辨別的聲音約34萬個。

主觀屬性


響度

表示的是一個聲音聽來有多響的程度。響度主要隨聲音的強度而變化,但也受頻率的影響。兩者的量的關係,按古典的心理物理學規律,響度與強度的對數成正比。為了檢驗這一假說的正確性,現代心理物理學進行了響度的定量判斷實驗,並建立了響度量表,其單位為宋(son)。1宋的定義為40dB1000Hz純音所引起的響度,大致相當於耳語的聲級。宋量表證明,響度正比於 1000Hz等響聲壓的0.6次冪,就是說,1000Hz等響聲的聲壓級提高10dB,響度加倍。前者稱為響度級,這說明響度的變化不是單純地決定於聲音強度,也與頻率有關。不同頻率的兩個純音,雖強度相同,引起的響度卻不同。總的說,中頻純音聽來比低頻和高頻純音響一些。以不同聲壓級的1000Hz純音為參照聲,通過響度平衡實驗,可以得到一簇等響線,如上圖所示。在一條等響線上,各頻率的純音儘管聲壓級不同,但都與該曲線上的1000Hz純音等響。1000Hz純音的這一聲壓級即定為此曲線上各純音的響度級,其單位稱為方(phon)。

音調

音調是聲音聽來調子高低的程度。音調主要決定於聲音的頻率,它隨頻率的升降而升降。但是,它也不是單純地由頻率決定,與聲音強度也有關係。低頻純音的音調隨強度增加而下降;反之,高頻純音的音調卻隨強度增加而上升。類似響度的宋量表,也制定了音調量表。音調定量判斷實驗是讓聽者調節發生器產生一系列純音,使它們在音調上聽來間隔相等。這樣取得的平均判斷構成了音調量表,其單位稱為美。在此量表上,1000Hz純音的音調被定為1000美(mel)。

音色

音色是對聲音音質的感覺。上面提過的純音不存在音色問題,它是伴隨複合聲出現的。明顯的例子是不同樂器所發出的聲音在音色上的不同。小提琴鋼琴發出的中央C,儘管它們響度和音調相同,聽起來還是不一樣,原因在於它們音色的差異。聲音的音色決定於它們的頻譜,即聲音諧波振幅的不同。複合聲這種多量綱的特點使得音色也具有多量綱性,不同於只有單個量綱的響度和音調。響度可以在宋量表上定出由響到輕的程度,音調可以在美量表上定出由高到低的程度,音色則只能用多維空間上相應的點來確定。言語聲的多維量表實驗證明,音色的知覺空間上的點與頻譜的物理空間上的點是非常吻合的。

音長

心理聲學
心理聲學
音長是聲音長短的感覺。聲音的參量作為時間的函數只要有兩個清楚的變化便可產生主觀音長感覺。最簡單的例子是一個聲脈衝或一段休止,它們都只有一頭一尾的變化。很久以來,人們總以為音長和聲音的物理長短是相等的,忽視了對它的研究。其實,在極端情況下兩者可相差四五倍之多。這是用脈衝聲和短於 500ms的休止所作的實驗結果。音長受聲級的影響不大,但頻率對它的影響卻不可忽視,尤其是300ms以下的短聲。如果以3 200Hz的脈衝聲作參照,頻率在它上下的脈衝聲必須有較長的物理聲長才能產生相等的音長感覺。用這種音長平衡實驗可以得到一簇類似於等響線的等音長線。

聲學效應


餘音

對於純音,聲音的音調主要決定於頻率,而對於由基波和諧波組成的複合聲,自H.von亥姆霍茲以來,普遍認為複合聲的音調決定於基波的頻率,因為基波的振幅在頻譜中佔優勢,而且給人的感覺也的確如此。但是實驗表明,若複合聲的基頻很弱,甚至完全被濾掉,它的音調仍維持基頻的音調不變。這種失去基頻的音調被稱為餘音。日常生活中也有餘音效應。人們的言語聲是以聲帶發出的低頻聲為基頻的。在電話中,它雖然被濾掉,說話的聲調並沒有受到影響。餘音現象所以受到注意是因為它涉及到一個基本的聽覺理論問題,即音調究竟決定於頻率,還是決定於周期性。目前的研究還不能作出結論。

聲掩蔽

一個聲信號如果與一種雜訊同時出現,它將變得微弱或完全聽不清楚,即是說信號的聽閾提高了。這就是掩蔽效應,雜訊掩蔽了信號。掩蔽效應的大小取決於雜訊和信號在頻率上的關係。一般說,信號與雜訊的頻率越接近,掩蔽也越大,且低頻雜訊對高頻信號的掩蔽常大於高頻雜訊對低頻信號的掩蔽。通過帶寬可變的雜訊對純音信號的掩蔽實驗發現,當以 1000Hz為中心頻率的雜訊增加帶寬時,它對 1000Hz純音信號的掩蔽效應也隨著增加。但帶寬增至100Hz以後,再增加就對掩蔽的改變不起作用。就是說,這個雜訊的掩蔽作用只限制在這個頻帶內,以外的聲音無作用。這個100Hz的頻帶稱為臨界頻帶。它隨頻率的提高而加寬。

非線性

人耳的傳輸特性與其他換能器一樣,帶有一些非線性的特點。它的產物就是所謂“合音”的感覺。合音包括差音、和音兩種。差音的例子:當兩個純音同時以400Hz和500Hz同時發出時,仔細聽起來還有頻率為其差值(100)及其諧頻的差值(200,300)的音,這就是差音。和音的頻率則是原來兩純音頻率之和,在這一例子中就是900Hz。它與差音相似,不過較弱一些,音調高一些。此外,還有在適當頻率和強度關係下一個音可以抑制或降低另一個音的響應(感覺)。這些現象一般用耳蝸的非線性反應解釋。
雙耳效應很多聽覺效果,決定於人有兩隻耳朵。聲源定位的主要因素為兩耳的時間差和強度差(見生理聲學)。由於頭部、耳廓、外耳道等的共振反射作用,使聽到的聲音頻譜受到調製。來自右邊的聲音先到達右耳,強度也比左耳收到的強。聲源方向常通過頭的轉動確定。複合聲的定位比純音容易,純音,尤其是2000~3000Hz的純音,定位特別困難。例如蟋蟀的唧唧聲就是這樣,雖然它還不是嚴格的純音。在可聽聲範圍內,耳廓的指向性不顯著,但對定位仍有作用。在低頻率,兩耳強度差別不大,定位主要靠相位因素或時間因素。在高頻率,相位變化複雜,強度差更為重要。在中頻,定位更依賴時間和強度的綜合作用。