질문
1. unvoiced speech의 power spectrum 식이 왜 저렇게 나오나요?
2. pitch frequency가 110Hz인 이유
3. 왜 STFT를 해야할까?
4. $e^{j\omega_0n}$의 DTFT는 뭘까요?
- $2\pi \delta(\omega-\omega_0)$
5. Linear filtering이 뭐고 왜 Short-Time Fourier Analysis를 Linear filtering이라고 해석할 수 있어요?
- Linear의 의미 생각해보기
- 입력은 frequency shifted된 신호, output은 STFT된 신호
6. rectangular window와 hamming window에 따른 short-time spectrum 해석하기
7. 196Hz, 392Hz가 의미하는 게 뭘까요?
- mainlobe의 bandwidth
- cutoff frequency
8. 위 그림에서 sidelobe가 커서 어떤 문제가 생기나요?
- frequency selectivity, spectral leakage는 tradeoff 관계, 블러링 의미 찾아보기
- 블러링: 위쪽은 sidelobe 영향 때문에 없는데 있다고, 아래쪽은 이쯤에서 있다는 걸 보여줌
9. Modulation의 의미
10. STFT 두가지 관점 해석
- DTFT
- Linear filtering
+) 참고
1. 단일한 주파수 신호 $e^{j\Omega t}$와의 내적으로 Fourier Transform 해석하기
2. eigenvalue, eigenfunction, Fourier Transform 개념을 통해 LTI 시스템 해석하기
11. 실제로 STFT를 할 때, 아래 조건을 만족하는가? 윈도우 75% overlap을 하는가?
- window type, cutoff frequency에 영향을 받음
- 보통 실험할 때는 50% 정도 overlap
12. Wavelet Transform을 통한 신호 분석 할 때 알면 좋을듯
'연구 노트 > 음성신호처리' 카테고리의 다른 글
Python으로 STFT 직접 구현해보기 (0) | 2024.05.17 |
---|---|
2024.05.16 신입생 세미나 Frequency-Domain Representations 질문 정리 (0) | 2024.05.16 |
Coherence 개념으로 Diffuse noise 모델링 (0) | 2024.05.09 |
2024.04.25-05.02 신입생 세미나 Time-domain Methods for Speech Processing 질문 정리 (0) | 2024.04.25 |
Speech Quality 평가지표 정리 (SNR, SI-SDR, PESQ, STOI / MOS, MUSHRA) (0) | 2024.04.24 |