논문정리3 [논문 정리] TF-Mamba: A Time-Frequency Network for Sound Source Localization 목차0. Summary1. Proposed TF-Mamba 1-1. Mamba 1-2. Network Architecture2. Experimental Setting 2-1. Dataset 2-2. Metrics3. Results & Analysis 0. Summary노이즈가 많고 잔향이 있는 까다로운 음향 환경에서 source localization을 수행하기 위해, 공간적 특징 (spatial feature)을 효과적으로 추출하는 것이 중요합니다. 본 논문 [1]의 베이스라인으로 사용된 FN-SSL [2]에서는 LSTM 기반 모델이 충분히 좋은 single moving source localization 성능을 보여주었습니다. 이 논문에선 scalable SSM (State sp.. 2024. 11. 5. [논문 정리] RawBMamba: End-to-End Bidirectional State Space Model for Audio Deepfake Detection 목차0. Summary1. Background2. Proposed method 2-1. Short-range feature representation 2-2. Bidirectional state space model3. Experiments 3-1. Dataset & Metrics 3-2. Analysis4. Memo 0. Summaryfake audio를 가려내는데 쓰이는 fake artefact는 short/long range segment 어디에서든 존재할 수 있습니다. 따라서, fake audio detection task에서는 local/global information을 모두 활용하는 것이 좋습니다. 본 논문 [1]은, audio deepfake detection을 위.. 2024. 10. 16. [세미나] Directional Gain Based Noise Covariance Matrix Estimation for MVDR Beamforming SummaryMVDR 빔포머 계산에 필요한 NCM을 추정하는 time-frequency mask estimator를 제안함제안된 mask estimator는 desired source의 방향 정보만을 이용해 추정되며 noise와 interference를 줄이는 postfilter로서 개발된 directional gain framework [2]를 사용함별도의 학습이 필요하지 않기 때문에, neural network 기반 estimator에서 겪는 generalization 문제를 겪지 않음closed form으로 정리되기 때문에, spatial clustering 기반 estimator에서의 반복 연산 과정을 필요로 하지 않으며 permutation 문제를 겪지 않음MPDR / mDF 빔포머와 비교했을 .. 2024. 5. 20. 이전 1 다음