2024.05.16 신입생 세미나 Frequency-Domain Representations 질문 정리
본문 바로가기
연구 노트/음성신호처리

2024.05.16 신입생 세미나 Frequency-Domain Representations 질문 정리

by NEWSUN* 2024. 5. 16.

질문

1. $R=L=N$일 때가 왜 practical하지 않을까?

 

2. rectanglur window

  • frequency selectivity를 생각해봤을 때, practical하지 않음

 

3. DFT 샘플보다 frame shift가 커질 수 없는 이유

  • inverse DFT 과정에서 time domain aliasing이 발생하게 됨

 

4. 여러 개의 bandpass로 분석하는 게 어떤 의의를 가질까요?

  • 각 frequency band마다 gain을 줌으로써 frequency 대역별로 가공할 수 있음

 

5. 위 filter에서 왜 modulation을 2번 하는 걸까? 

  • modulation이 STFT에 포함된 shift 과정이기 때문
  • DFT, IDFT 과정을 보여준 것

 

6. gain이 없다면, perfect하게 reconstruction되는가?

  • 모든 $P[k]$값이 1일 때 이 조건을 만족하면 perfect하게 reconstruction이 가능함

 

7. OLA method 직접 해봤나요? 수식/코딩으로 풀어보기

  • gain이 constant 값이면 원래 signal을 reconstruction 할 수 있음

 

8. 인간이 갖고 있는 filter bank 예시

  • cochlear filter, 저주파는 촘촘하고 고주파는 넓은 간격으로 모델링

 

9. Perfect Reconstruction 조건 설명하기

  • perfect reconstruction을 달성하려면 magnitude가 위 그림과 같이 일정 간격으로 0이 되어야 함
  • hamming window는 약간의 차이로 $k\pi/M$간격으로 0이 된다는 조건을 만족하지 않아 이론적으로 reconstruction이 어려움

 

10. reconstruction 조건이 어디서 나온건가?