聽覺場景分析
聽覺場景分析
在計算機聽覺研究領域裡,借鑒計算機視覺研究中的“視覺場景分析”概念而建立的聲音信號處理模型概念。在1990年對此方面的研究進行了詳盡的總結,總結出了以格式塔規則為基礎的一系列感知規則,首次提出了“聽覺場景分析”的概念。至2006年時,根據人類聽覺信號處理規則和特點建立起來的聽覺場景分析模型,已經達到了相當高的水平,能夠較好的將基頻分佈範圍處於相同頻帶上的多個同時語音進行分離。
目錄
在計算機聽覺研究領域裡,借鑒計算機視覺研究中的“視覺場景分析”概念而建立的聲音信號處理模型概念。
人類對於聲音信號的處理依據哪些規則,具有哪些特點?認知心理學很早就對於這個問題有了較為全面的答案。Bregman在1990年對此方面的研究進行了詳盡的總結,總結出了以格式塔規則為基礎的一系列感知規則,首次提出了“聽覺場景分析”的概念。
而在此之前,Weintraub於1985年就已建立了第一個模擬單耳聲源分離原理的人工聽覺系統,將兩個語音信號成功分離。這已經是聽覺場景分析模型的雛形。後續的研究沿著類似的思想,不斷地對模型進行完善。至2006年時,根據人類聽覺信號處理規則和特點建立起來的聽覺場景分析模型,已經達到了相當高的水平,能夠較好的將基頻分佈範圍處於相同頻帶上的多個同時語音進行分離。