剪輯點的「喀」一聲是哪來的?零交越與淡入淡出原理

喀聲的成因:波形被「剪斷」了

把一段音訊從中間剪開,剪輯點的波形大多不會剛好落在零點上。播放到這裡時,喇叭的振膜被迫從某個位置瞬間跳到另一個位置——這個不連續的跳變在訊號處理上等同一個瞬間的階躍,能量會擴散到整個頻譜(即頻譜分析中熟知的 spectral leakage 現象,可參考 Stanford CCRMA 的線上教科書《Spectral Audio Signal Processing》對訊號不連續與頻譜擴散的說明)。人耳聽到的就是一聲短促的「喀」或「啵」。

同樣的道理也解釋了為什麼把兩段音訊直接相接時,接縫處特別容易出現雜音:兩段波形在接點的振幅與斜率幾乎不可能剛好連續。

解法一:在零交越點下刀

零交越(zero crossing)指波形通過振幅為零的位置。在零交越點剪輯,跳變的幅度最小,喀聲自然減輕。許多剪輯軟體提供「snap to zero crossing」功能;手動剪輯時,把波形放大到取樣點等級、找波形穿越中線的位置下刀,效果相同。

不過零交越只保證振幅連續,不保證斜率連續,對低頻內容(貝斯、底鼓)有時仍會留下輕微的「噗」聲,這時就需要第二種解法。

解法二:淡入淡出(fade)

在剪輯點加上極短的淡出與淡入(數毫秒到數十毫秒),讓振幅平滑地降到零再升回來,從根本上消除不連續。這也是交叉淡化(crossfade)的原理:前段淡出與後段淡入重疊,接縫完全無痕。

MP3 切割工具 剪輯時,可直接對選取片段套用淡入淡出,匯出即帶平滑接點。

立即試用 MP3 切割工具

參考資料

  1. Julius O. Smith III, "Spectral Audio Signal Processing," Stanford University CCRMA 線上版(訊號不連續與頻譜擴散原理)。
    https://ccrma.stanford.edu/~jos/sasp/
  2. A. V. Oppenheim & R. W. Schafer, "Discrete-Time Signal Processing," Prentice Hall.(數位訊號處理標準教科書)