질문
1. $R=L=N$일 때가 왜 practical하지 않을까?
2. rectanglur window
- frequency selectivity를 생각해봤을 때, practical하지 않음
3. DFT 샘플보다 frame shift가 커질 수 없는 이유
- inverse DFT 과정에서 time domain aliasing이 발생하게 됨
4. 여러 개의 bandpass로 분석하는 게 어떤 의의를 가질까요?
- 각 frequency band마다 gain을 줌으로써 frequency 대역별로 가공할 수 있음
5. 위 filter에서 왜 modulation을 2번 하는 걸까?
- modulation이 STFT에 포함된 shift 과정이기 때문
- DFT, IDFT 과정을 보여준 것
6. gain이 없다면, perfect하게 reconstruction되는가?
- 모든 $P[k]$값이 1일 때 이 조건을 만족하면 perfect하게 reconstruction이 가능함
7. OLA method 직접 해봤나요? 수식/코딩으로 풀어보기
- gain이 constant 값이면 원래 signal을 reconstruction 할 수 있음
8. 인간이 갖고 있는 filter bank 예시
- cochlear filter, 저주파는 촘촘하고 고주파는 넓은 간격으로 모델링
9. Perfect Reconstruction 조건 설명하기
- perfect reconstruction을 달성하려면 magnitude가 위 그림과 같이 일정 간격으로 0이 되어야 함
- hamming window는 약간의 차이로 $k\pi/M$간격으로 0이 된다는 조건을 만족하지 않아 이론적으로 reconstruction이 어려움
10. reconstruction 조건이 어디서 나온건가?
'연구 노트 > 음성신호처리' 카테고리의 다른 글
2024.05.23 신입생 세미나 Frequency-Domain Representations 질문 정리 (0) | 2024.05.23 |
---|---|
Python으로 STFT 직접 구현해보기 (0) | 2024.05.17 |
2024.05.09 신입생 세미나 Frequency-Domain Representations 질문 정리 (0) | 2024.05.09 |
Coherence 개념으로 Diffuse noise 모델링 (0) | 2024.05.09 |
2024.04.25-05.02 신입생 세미나 Time-domain Methods for Speech Processing 질문 정리 (0) | 2024.04.25 |