2024.05.09 신입생 세미나 Frequency-Domain Representations 질문 정리

질문

1. unvoiced speech의 power spectrum 식이 왜 저렇게 나오나요?

2. pitch frequency가 110Hz인 이유

3. 왜 STFT를 해야할까?

FFT 수행 시 zero padding이 frequency resolution에 미치는 영향

STFT 결과로 얻게 된 frequency bin이 무엇인지 알아보고 FFT 수행 과정에서 zero padding이 frequency resolution에 어떤 영향을 미치는지 알아봅시다. STFT (Short-time Fourier Transform)음성 신호는 시간에 따라 변화

sunny-archive.tistory.com

4. $e^{j ω_{0} n}$ 의 DTFT는 뭘까요?

$2 π δ (ω - ω_{0})$

5. Linear filtering이 뭐고 왜 Short-Time Fourier Analysis를 Linear filtering이라고 해석할 수 있어요?

Linear의 의미 생각해보기
입력은 frequency shifted된 신호, output은 STFT된 신호

6. rectangular window와 hamming window에 따른 short-time spectrum 해석하기

Hamming window와 Rectangular window 비교

window 개념을 살펴보기 전에, 왜 신호를 짧은 시간 단위로 나눠 주파수 분석을 수행하는지에 대해 알아봅시다. STFT를 하는 이유 음성 신호는 time-varying, non-stationary 특성을 가지고 있어서 정확한

sunny-archive.tistory.com

7. 196Hz, 392Hz가 의미하는 게 뭘까요?

mainlobe의 bandwidth
cutoff frequency

8. 위 그림에서 sidelobe가 커서 어떤 문제가 생기나요?

frequency selectivity, spectral leakage는 tradeoff 관계, 블러링 의미 찾아보기
블러링: 위쪽은 sidelobe 영향 때문에 없는데 있다고, 아래쪽은 이쯤에서 있다는 걸 보여줌

9. Modulation의 의미

10. STFT 두가지 관점 해석

DTFT
Linear filtering

+) 참고

1. 단일한 주파수 신호 $e^{j Ω t}$ 와의 내적으로 Fourier Transform 해석하기

내적 (inner product) & 정사영 (projection) 개념으로 Fourier Transform 해석하기

내적, 정사영, 단위벡터 개념을 알아보고 벡터 내적 관점으로 fourier transfrom 식을 해석해봅시다. 내적 (inner product)두 벡터가 얼마나 닮았는가, 즉 닮은 정도를 나타냅니다. 아래의 그림을 보면,

sunny-archive.tistory.com

2. eigenvalue, eigenfunction, Fourier Transform 개념을 통해 LTI 시스템 해석하기

고윳값 (eigenvalue), 고유 함수 (eigenfunction) 개념으로 LTI 시스템 해석하기

선형대수에서 중요한 개념인 고윳값 (eigenvalue), 고유 벡터 (eigenvector) 그리고 고유 함수 (eigenfunction)의 정의를 살펴보고 LTI 시스템에서 각각 어떻게 나타나는지 알아봅시다. 고윳값과 고유 벡터 $$

sunny-archive.tistory.com

11. 실제로 STFT를 할 때, 아래 조건을 만족하는가? 윈도우 75% overlap을 하는가?

window type, cutoff frequency에 영향을 받음
보통 실험할 때는 50% 정도 overlap

12. Wavelet Transform을 통한 신호 분석 할 때 알면 좋을듯

Wavelet Transform 기본개념 및 Fourier Transform 비교

본 글은 이 글을 번역 + 재구성한 글입니다. Fourier Transform 기반의 MFCC 등을 이용한 음성 데이터 분석 방법들에 대한 포스팅은 찾기 쉬운데, Wavelet Transformation에 대해서는 한글로 된 글이 많이 없어

hyongdoc.tistory.com

'연구 노트 > 음성신호처리' 카테고리의 다른 글

Python으로 STFT 직접 구현해보기 (0)	2024.05.17
2024.05.16 신입생 세미나 Frequency-Domain Representations 질문 정리 (0)	2024.05.16
Coherence 개념으로 Diffuse noise 모델링 (0)	2024.05.09
2024.04.25-05.02 신입생 세미나 Time-domain Methods for Speech Processing 질문 정리 (0)	2024.04.25
Speech Quality 평가지표 정리 (SNR, SI-SDR, PESQ, STOI / MOS, MUSHRA) (0)	2024.04.24

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Sunny Archive ☀️

2024.05.09 신입생 세미나 Frequency-Domain Representations 질문 정리

질문

'연구 노트 > 음성신호처리' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

2024.05.09 신입생 세미나 Frequency-Domain Representations 질문 정리

질문

'연구 노트 > 음성신호처리' 카테고리의 다른 글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역