728x90 반응형 real time2 Real Time Speech Enhancement in the Waveform Domain 논문 원본: https://arxiv.org/pdf/2006.12847[Abstract] - 이 논문에서는 cpu에서도 실시간으로 잘 작동하는 Sound Enhancement model을 제안했다. - 모델의 아키텍처는 encoder-decoder, skip-connections으로 구성되어 있다. - 위의 모델은 시간, 주파주 도메인에 최적화되며, 여러 손실 함수를 사용했다. - 우리는 모델 성능과 일반화 능력을 더욱 향상시키기 위해 원시 파형(raw waveform)에 직접 적용되는 일련의 데이터 증강 기법을 제안함. [Introduction] - 우리는 실시간 버전의 'DEMUCS' 아키텍처를 제안했다. - speech enhancement는 여러 개의 metrics이 존재하는데 인간의 평가와는 c.. 2024. 5. 23. Towards_Real-Time_4K_Image_Super-Resolution_CVPRW_2023 논문 관련 링크: https://paperswithcode.com/paper/towards-real-time-4k-image-super-resolution Papers with Code - Towards Real-Time 4K Image Super-Resolution Implemented in 2 code libraries. paperswithcode.com 논문을 읽은 이유: 현재 연구소에서 개발중인 군용 Super-Resolution Task 모델의 아키텍처 구성 요소를 바꾸는 과정에서 영감을 얻고자 했다. 특히, Real-Time이라는 키워드에 이끌려 논문을 열었다. [Abstract] 현재는 FHD, UHD가 화질의 기준이 되어버렸습니다. 이로인해 많은 곳에서 기준을 맞추기 위해 '실시간'으로 화.. 2024. 2. 7. 이전 1 다음 728x90 반응형