오디오 신호 처리에 사용되는 기술인 Pre-emphasis filtering에 대해 알아봅시다.
Pre-emphasis filtering
위 그림은 넓은 주파수 대역에서 음성 신호의 average magnitude spectrum을 나타낸 것입니다. 저주파에서는 높은 에너지를 가지고 있는 반면, 고주파로 갈수록 에너지가 줄어드는 것을 관찰할 수 있습니다. 이는 인간의 발성기관과 소리의 특성에 의해 발생하게 되는데 이 내용은 밑에서 자세하게 설명하도록 하겠습니다.
위에서 보았던 것처럼 고주파의 에너지가 감소하는 문제를 pre-emphasis filtering이라는 전처리 방법을 통해 해결할 수 있습니다. 사람의 음성이 저주파 대역에서 강조되고 고주파 대역에서는 크기가 작아지는 특성이 있기 때문에 전처리를 통해 상대적으로 약한 부분을 강조할 수 있습니다.
$y_t = ax_t + (1-a)x_{t-1}$
다음 필터링 공식을 이용하여 저주파 대역의 크기를 줄이고 고주파 대역의 크기를 증가시켜줌으로써 주파수 스펙트럼 간 균형을 맞춰줄 수 있습니다.
$s(n)=s(n)-0.9375 \cdot s(n-1)$
pre-emphasis filtering은 위와 같은 식으로 흔하게 사용한다고 합니다.
전처리를 하는 이유
LPC analysis와 같은 신호처리 기법을 적용해 음성을 처리하는 경우, 고주파보단 저주파 대역의 주파수 성분에 대한 정확도가 더 높은 경향이 있습니다. 이는 음성이 발화될 때, 발성기관 내 높은 압력에서 대기 중의 낮은 압력으로 나오게 되는데 이때 spectral roll-off가 발생하여 고주파수의 진폭이 감소하기 때문입니다. LPC filter는 vocal tract을 모델링한 것이기 때문에 입의 방사(lip radiation)로 인한 영향을 최대한 배제해야 합니다.이러한 이유로, 상대적으로 낮은 고주파 대역의 주파수 성분에 대한 정확도를 높이고자 LPC analysis 전에 pre-emphasis filtering을 수행하는 것이 일반적이라고 합니다.
Reference
[1] H Puder, Applied speech and audio processing. Amsterdam Elsevier, 2006.
[2] J. Seok, “Pre-emphasis filtering, Ceptral mean normalization,” junn.net, Jul. 19, 2017. https://junn.net/archives/359 (accessed Nov. 10, 2023).
[3] “4.1. Pre-emphasis — Introduction to Speech Processing,” speechprocessingbook.aalto.fi. https://speechprocessingbook.aalto.fi/Preprocessing/Pre-emphasis.html (accessed Nov. 10, 2023).
'연구 노트 > 음성신호처리' 카테고리의 다른 글
Wiener filter: 신호 필터링, 예측을 하는데 쓰는 linear filter (2) | 2024.03.13 |
---|---|
MVDR beamformer 완전 정복 (1) | 2024.03.12 |
Multi-Channel 신호처리 & 빔포밍 (Beamforming)에 대한 고찰 (1) | 2024.03.07 |
FFT 수행 시 zero padding이 frequency resolution에 미치는 영향 (0) | 2024.02.14 |
Hamming window와 Rectangular window 비교 (2) | 2023.11.09 |