心理聲學
心理聲學
心理聲學(psychoacoustics)是研究聲音和它引起的聽覺之間關係的一門邊緣學科。心理聲學一詞似乎很令人費解,其實很簡單,它就是指“人腦解釋聲音的方式”。壓縮音頻的所有形式都是用功能強大的演演算法將我們聽不到的音頻信息去掉。例如,如果我扯著嗓子喊一聲,同時輕輕地踏一下腳,您就會聽到我的喊聲,但可能聽不到我踏腳的聲音。通過去掉踏腳聲,就會減少信息量,減小文件的大小,但聽起來卻沒有區別。
心理聲學模型是對人聽感的統計性質的數學表述模型,它解釋人各種聽感的生理原理。
心理聲學模型可以在主觀聽感劣化不多的條件下,大大降低數字音頻信號傳輸的帶寬。它主要基於人的聽覺器官的生理結構和感知模式,通過對數字音頻信號的相應處理,去除不可聞的信號成分及引入不可聞的畸變,達到普通熵編碼無法達到的壓縮比率。
由於人耳聽覺系統複雜,人類迄今為止對它的機理和聽覺特性的某些問題總是還不能從生理解剖角度完全解釋清楚。所以,對人耳聽覺特性的研究僅限於在心理聲學和語言聲學內進行。人耳對不同強度和不同頻率聲音的一定聽覺範圍稱為聲域。在人耳的聲域範圍內,聲音聽覺心理的主觀感受主要有響度、音高、音色等特徵和掩蔽效應、高頻定位等特性。其中響度、音度、音色可以在主觀上用來描述具有振幅、頻率和相位三個物理是的任何複雜的聲音,故又稱為聲音“三要素”;而對於多種音源場合的人的耳掩蔽效應等特性尤為重要,它是心理聲學的基礎。
研究聲音和它引起的聽覺之間關係的一門邊緣學科。它既是聲學的一個分支,也是心理物理學的一個分支。心理聲學本可包括言語和音樂這樣一些複合聲和它們的知覺。這些可見語言聲學、音樂聲學等條,本條只限於較基礎和簡單的心理聲學現象,即①剛剛能引起聽覺的聲音──聽閾;②聲音的強度、頻率、頻譜和時長這些參量所決定的聲音的主觀屬性──響度、音調、音色和音長;③某些和複合聲音有關的特殊的心理聲學效應──餘音、掩蔽、非線性、雙耳效應。
聽閾分強度閾和差閾。聲音不夠一定強度不能引起聽覺。在多次作用中能有50%的次數引起聽覺的最小聲壓級稱為強度閾(也稱聽閾)。聽閾有個體差異,因而所謂正常聽閾只能是一些聽力正常的年輕人的聽閾的統計平均值。聽閾隨頻率而變化。500~4000Hz之間閾值最低,在它們之上和之下的高頻聲和低頻聲的閾值都較高,如20Hz純音的閾值比1000Hz純音的閾值約高70dB,10000Hz純音的閾值也比 1000Hz純音的閾值約高10dB。最敏感的頻率是3000Hz左右,空氣分子振動的振幅達到10-11m 就可以聽到,這隻有氫氣分子的直徑的十分之一。聽閾隨年齡而增高,特別是高頻部分,表現為老年聾,如70歲的老人,5000Hz純音的聽閾約增高45dB。聽閾的概念還包括差閾,即兩個聲音引起聽覺差別的最小可覺差。就頻率說,在63Hz左右有經驗的人耳能區別相差0.5Hz的兩個純音的差別,但這種閾值在1000Hz要增加到1.4Hz,頻率越高差閾越大。人耳能區別的強度差值最小0.25dB(1000~4000Hz,70dB以上),強度低或頻率更高或更低時,強度差閾更大。在整個聽覺範圍內,可辨別的聲音約34萬個。
表示的是一個聲音聽來有多響的程度。響度主要隨聲音的強度而變化,但也受頻率的影響。兩者的量的關係,按古典的心理物理學規律,響度與強度的對數成正比。為了檢驗這一假說的正確性,現代心理物理學進行了響度的定量判斷實驗,並建立了響度量表,其單位為宋(son)。1宋的定義為40dB1000Hz純音所引起的響度,大致相當於耳語的聲級。宋量表證明,響度正比於 1000Hz等響聲壓的0.6次冪,就是說,1000Hz等響聲的聲壓級提高10dB,響度加倍。前者稱為響度級,這說明響度的變化不是單純地決定於聲音強度,也與頻率有關。不同頻率的兩個純音,雖強度相同,引起的響度卻不同。總的說,中頻純音聽來比低頻和高頻純音響一些。以不同聲壓級的1000Hz純音為參照聲,通過響度平衡實驗,可以得到一簇等響線,如上圖所示。在一條等響線上,各頻率的純音儘管聲壓級不同,但都與該曲線上的1000Hz純音等響。1000Hz純音的這一聲壓級即定為此曲線上各純音的響度級,其單位稱為方(phon)。
音調是聲音聽來調子高低的程度。音調主要決定於聲音的頻率,它隨頻率的升降而升降。但是,它也不是單純地由頻率決定,與聲音強度也有關係。低頻純音的音調隨強度增加而下降;反之,高頻純音的音調卻隨強度增加而上升。類似響度的宋量表,也制定了音調量表。音調定量判斷實驗是讓聽者調節發生器產生一系列純音,使它們在音調上聽來間隔相等。這樣取得的平均判斷構成了音調量表,其單位稱為美。在此量表上,1000Hz純音的音調被定為1000美(mel)。
音色是對聲音音質的感覺。上面提過的純音不存在音色問題,它是伴隨複合聲出現的。明顯的例子是不同樂器所發出的聲音在音色上的不同。小提琴和鋼琴發出的中央C,儘管它們響度和音調相同,聽起來還是不一樣,原因在於它們音色的差異。聲音的音色決定於它們的頻譜,即聲音諧波振幅的不同。複合聲這種多量綱的特點使得音色也具有多量綱性,不同於只有單個量綱的響度和音調。響度可以在宋量表上定出由響到輕的程度,音調可以在美量表上定出由高到低的程度,音色則只能用多維空間上相應的點來確定。言語聲的多維量表實驗證明,音色的知覺空間上的點與頻譜的物理空間上的點是非常吻合的。
心理聲學
對於純音,聲音的音調主要決定於頻率,而對於由基波和諧波組成的複合聲,自H.von亥姆霍茲以來,普遍認為複合聲的音調決定於基波的頻率,因為基波的振幅在頻譜中佔優勢,而且給人的感覺也的確如此。但是實驗表明,若複合聲的基頻很弱,甚至完全被濾掉,它的音調仍維持基頻的音調不變。這種失去基頻的音調被稱為餘音。日常生活中也有餘音效應。人們的言語聲是以聲帶發出的低頻聲為基頻的。在電話中,它雖然被濾掉,說話的聲調並沒有受到影響。餘音現象所以受到注意是因為它涉及到一個基本的聽覺理論問題,即音調究竟決定於頻率,還是決定於周期性。目前的研究還不能作出結論。
一個聲信號如果與一種雜訊同時出現,它將變得微弱或完全聽不清楚,即是說信號的聽閾提高了。這就是掩蔽效應,雜訊掩蔽了信號。掩蔽效應的大小取決於雜訊和信號在頻率上的關係。一般說,信號與雜訊的頻率越接近,掩蔽也越大,且低頻雜訊對高頻信號的掩蔽常大於高頻雜訊對低頻信號的掩蔽。通過帶寬可變的雜訊對純音信號的掩蔽實驗發現,當以 1000Hz為中心頻率的雜訊增加帶寬時,它對 1000Hz純音信號的掩蔽效應也隨著增加。但帶寬增至100Hz以後,再增加就對掩蔽的改變不起作用。就是說,這個雜訊的掩蔽作用只限制在這個頻帶內,以外的聲音無作用。這個100Hz的頻帶稱為臨界頻帶。它隨頻率的提高而加寬。