질문
1. unvoiced speech의 power spectrum 식이 왜 저렇게 나오나요?
2. pitch frequency가 110Hz인 이유
3. 왜 STFT를 해야할까?
FFT 수행 시 zero padding이 frequency resolution에 미치는 영향
STFT 결과로 얻게 된 frequency bin이 무엇인지 알아보고 FFT 수행 과정에서 zero padding이 frequency resolution에 어떤 영향을 미치는지 알아봅시다. STFT (Short-time Fourier Transform)음성 신호는 시간에 따라 변화
sunny-archive.tistory.com
4. $e^{j\omega_0n}$의 DTFT는 뭘까요?
- $2\pi \delta(\omega-\omega_0)$
5. Linear filtering이 뭐고 왜 Short-Time Fourier Analysis를 Linear filtering이라고 해석할 수 있어요?
- Linear의 의미 생각해보기
- 입력은 frequency shifted된 신호, output은 STFT된 신호
6. rectangular window와 hamming window에 따른 short-time spectrum 해석하기
Hamming window와 Rectangular window 비교
window 개념을 살펴보기 전에, 왜 신호를 짧은 시간 단위로 나눠 주파수 분석을 수행하는지에 대해 알아봅시다. STFT를 하는 이유 음성 신호는 time-varying, non-stationary 특성을 가지고 있어서 정확한
sunny-archive.tistory.com
7. 196Hz, 392Hz가 의미하는 게 뭘까요?
- mainlobe의 bandwidth
- cutoff frequency
8. 위 그림에서 sidelobe가 커서 어떤 문제가 생기나요?
- frequency selectivity, spectral leakage는 tradeoff 관계, 블러링 의미 찾아보기
- 블러링: 위쪽은 sidelobe 영향 때문에 없는데 있다고, 아래쪽은 이쯤에서 있다는 걸 보여줌
9. Modulation의 의미
10. STFT 두가지 관점 해석
- DTFT
- Linear filtering
+) 참고
1. 단일한 주파수 신호 $e^{j\Omega t}$와의 내적으로 Fourier Transform 해석하기
내적 (inner product) & 정사영 (projection) 개념으로 Fourier Transform 해석하기
내적, 정사영, 단위벡터 개념을 알아보고 벡터 내적 관점으로 fourier transfrom 식을 해석해봅시다. 내적 (inner product)두 벡터가 얼마나 닮았는가, 즉 닮은 정도를 나타냅니다. 아래의 그림을 보면,
sunny-archive.tistory.com
2. eigenvalue, eigenfunction, Fourier Transform 개념을 통해 LTI 시스템 해석하기
고윳값 (eigenvalue), 고유 함수 (eigenfunction) 개념으로 LTI 시스템 해석하기
선형대수에서 중요한 개념인 고윳값 (eigenvalue), 고유 벡터 (eigenvector) 그리고 고유 함수 (eigenfunction)의 정의를 살펴보고 LTI 시스템에서 각각 어떻게 나타나는지 알아봅시다. 고윳값과 고유 벡터 $$
sunny-archive.tistory.com
11. 실제로 STFT를 할 때, 아래 조건을 만족하는가? 윈도우 75% overlap을 하는가?
- window type, cutoff frequency에 영향을 받음
- 보통 실험할 때는 50% 정도 overlap
12. Wavelet Transform을 통한 신호 분석 할 때 알면 좋을듯
Wavelet Transform 기본개념 및 Fourier Transform 비교
본 글은 이 글을 번역 + 재구성한 글입니다. Fourier Transform 기반의 MFCC 등을 이용한 음성 데이터 분석 방법들에 대한 포스팅은 찾기 쉬운데, Wavelet Transformation에 대해서는 한글로 된 글이 많이 없어
hyongdoc.tistory.com
'연구 노트 > 음성신호처리' 카테고리의 다른 글
Python으로 STFT 직접 구현해보기 (0) | 2024.05.17 |
---|---|
2024.05.16 신입생 세미나 Frequency-Domain Representations 질문 정리 (0) | 2024.05.16 |
Coherence 개념으로 Diffuse noise 모델링 (0) | 2024.05.09 |
2024.04.25-05.02 신입생 세미나 Time-domain Methods for Speech Processing 질문 정리 (0) | 2024.04.25 |
Speech Quality 평가지표 정리 (SNR, SI-SDR, PESQ, STOI / MOS, MUSHRA) (0) | 2024.04.24 |