728x90 반응형 Speech enhancement1 Real Time Speech Enhancement in the Waveform Domain 논문 원본: https://arxiv.org/pdf/2006.12847[Abstract] - 이 논문에서는 cpu에서도 실시간으로 잘 작동하는 Sound Enhancement model을 제안했다. - 모델의 아키텍처는 encoder-decoder, skip-connections으로 구성되어 있다. - 위의 모델은 시간, 주파주 도메인에 최적화되며, 여러 손실 함수를 사용했다. - 우리는 모델 성능과 일반화 능력을 더욱 향상시키기 위해 원시 파형(raw waveform)에 직접 적용되는 일련의 데이터 증강 기법을 제안함. [Introduction] - 우리는 실시간 버전의 'DEMUCS' 아키텍처를 제안했다. - speech enhancement는 여러 개의 metrics이 존재하는데 인간의 평가와는 c.. 2024. 5. 23. 이전 1 다음 728x90 반응형