數位音訊範例

這裡以一份極短的人聲音訊「計算機概論十六講」為例, 用幾種取樣頻率與訊號解析度分別錄音,讓讀者聆聽其效果。 此外示範兩種取樣頻率所獲得的頻譜圖,觀察聲波之頻率變化。 還有一個 Java 軟體,顯示聲音函數的圖形。 最後示範三種壓縮率的 MP3 檔案,供讀者比較。 只要您的電腦有音效卡與揚聲器,就應該可以播放。

   單聲軌 (Mono) 標準高傳真 (Hi-Fi) 音效:取樣頻率 44,100 Hz,解析度 16 嗶。 檔案含量 139,746 拜。

以上數位音訊大約有 1.584 秒,每秒 44,100 個取樣值,共有 69,850 個數值。 這些數值在座標平面上畫出函數圖形如下: 其中橫軸代表時間,縱軸代表相對壓力。 按 + 號放大橫軸單位十倍 (一個橫幅大約 0.158 秒), 按 - 號還原橫軸單位 (整個橫幅大約 1.58 秒)。

以下是上述音訊的頻譜圖。橫軸代表時間、縱軸代表頻率、顏色代表振幅 (越「冷」的顏色代表越低的振幅,越「熱」的顏色代表越高的振幅)。 由於取樣頻率是 44,100 Hz 所以能夠正確錄製 22,050 Hz 以下的音訊。 觀察錄音中男聲的頻率大多在 2,000 Hz 以下,但是也有少數頻率在 6,000 Hz 與 10,000 Hz 上。女聲的頻率通常稍微高些, 而樂器 (例如鋼琴、小提琴) 還可以發出更高頻的聲音。


「計算機概論十六講」頻譜圖

以下是一些較低品質的音訊,可聆聽比較。注意檔案含量之間的關係。

   單聲軌 (Mono) 音訊:取樣頻率 22,050 Hz,解析度 16 嗶。 檔案含量 69,896 拜。

   單聲軌 (Mono) 音訊:取樣頻率 11,025 Hz,解析度 16 嗶。 檔案含量 34,982 拜。

   單聲軌 (Mono) 音訊:取樣頻率 8,000 Hz,解析度 16 嗶。 檔案含量 25,390 拜。

聆聽以上三種取樣頻率較低的音訊,很明顯地,8,000 Hz 的聲音走樣最多。 這是因為這份錄音只能正確錄製 4,000 Hz 以下的音訊, 相當於「濾掉」了 6,000 Hz 和 10,000 Hz 部份的音訊, 所以聽起來聲音就變調了。頻譜如下:


「計算機概論十六講」8,000 Hz 頻譜圖

以下是三種較低取樣頻率再降低訊號解析度的音訊。 注意檔案含量之間的關係。因為音訊內容簡單,所以可能在嘈雜環境中聽不出什麼差異。 需要在專業的播放器材與環境中,才能聽出差異。

   單聲軌 (Mono) 音訊:取樣頻率 22,050 Hz,解析度 8 嗶。 檔案含量 34,971 拜。

   單聲軌 (Mono) 音訊:取樣頻率 11,025 Hz,解析度 8 嗶。 檔案含量 17,514 拜。

   單聲軌 (Mono) 音訊:取樣頻率 8,000 Hz,解析度 8 嗶。 檔案含量 12,718 拜。

最後列出三份不同資料流量的 MP3 音訊檔案,全部是從高傳真音訊壓縮而得。 原來的音訊檔案含量是 139,746 拜。您的瀏覽器未必可以直接播放這些 MP3 格式的音訊, 請下載後以適當的播放軟體 (例如 Winamp) 聆聽。 其實,因為音訊內容簡單 (人聲而已),因此大概聽不出差異。 留意檔案含量之間的關係。

以 64 kbps 為例,因為壓縮後每秒保留 64 K 嗶,等於每秒 8192 拜, 而此聲音原有大約 1.58 秒,故應有 12,943 拜。 真實檔案因為添加少量額外資料,故為 12,956 拜。 與未壓縮的 wav 格式相比,壓縮比大約是 1:11。


[ 發表感想或意見 ] ‧ [ 讀者推薦課外讀物 ]

BCC16 Home Up Chap 0 Chap 1 Chap 2 Chap 3 Chap 4 Chap 5 Chap 6 Chap 7 Chap 8 Chap 9 Chap A Chap B Chap C Chap D Chap E Chap F Copyright Pool User
製作人、
修改記錄
聲音:單維彰、錄音:梅少文、錄音室:漢聲廣播電台、 音訊檔案製作:羅啟仁、網頁與 Java 製作:張智韶
單維彰 (2002/11/03) --- 02/12/26 (單)