본문 바로가기
728x90
반응형

분류 전체보기100

Real Time Speech Enhancement in the Waveform Domain 논문 원본: https://arxiv.org/pdf/2006.12847[Abstract] - 이 논문에서는 cpu에서도 실시간으로 잘 작동하는 Sound Enhancement model을 제안했다. - 모델의 아키텍처는 encoder-decoder, skip-connections으로 구성되어 있다. - 위의 모델은 시간, 주파주 도메인에 최적화되며, 여러 손실 함수를 사용했다. - 우리는 모델 성능과 일반화 능력을 더욱 향상시키기 위해 원시 파형(raw waveform)에 직접 적용되는 일련의 데이터 증강 기법을 제안함. [Introduction] - 우리는 실시간 버전의 'DEMUCS' 아키텍처를 제안했다. - speech enhancement는 여러 개의 metrics이 존재하는데 인간의 평가와는 c.. 2024. 5. 23.
[논문리뷰]SeD: Semantic-Aware Discriminator for Image Super-Resolution 논문: https://arxiv.org/pdf/2402.19387.pdf github: https://github.com/lbc12345/SeD [Abstract] GANs은 super resolution task에서 널리 사용되었습니다. 관련 내용 중에서 'Discriminator' real-world의 고화질 이미지로 만드는 adversarial training에서 활용되어졌습니다. 그러나, 이미지의 텍스처 질감을 너무 과도하게 강조하여 실제와는 다른 가상적인 질감을 생성할 수 있으며 모델이 예상한 결과와 다르게 생성물을 만들어낼 수 있습니다. 이를 완화하기 위해서, 간단하고 효과적인 'SeD'를 제안했습니다. 이는 SR 네트워크가 이미지의 의미론적 정보를 조건으로 도입함으로써 세밀한 분포를 학습하도.. 2024. 3. 25.
[논문리뷰] Activating More Pixels in Image Super-Resolution Transformer(HAT) "Activating More Pixel in Image Super-Resolution Transformer" paper: https://arxiv.org/abs/2205.04437 GitHub: https://github.com/XPixelGroup/HAT Activating More Pixels in Image Super-Resolution Transformer Transformer-based methods have shown impressive performance in low-level vision tasks, such as image super-resolution. However, we find that these networks can only utilize a limited spatial r.. 2024. 3. 19.
Towards_Real-Time_4K_Image_Super-Resolution_CVPRW_2023 논문 관련 링크: https://paperswithcode.com/paper/towards-real-time-4k-image-super-resolution Papers with Code - Towards Real-Time 4K Image Super-Resolution Implemented in 2 code libraries. paperswithcode.com 논문을 읽은 이유: 현재 연구소에서 개발중인 군용 Super-Resolution Task 모델의 아키텍처 구성 요소를 바꾸는 과정에서 영감을 얻고자 했다. 특히, Real-Time이라는 키워드에 이끌려 논문을 열었다. [Abstract] 현재는 FHD, UHD가 화질의 기준이 되어버렸습니다. 이로인해 많은 곳에서 기준을 맞추기 위해 '실시간'으로 화.. 2024. 2. 7.
To learn image super-resolution, use a GAN to learn how to do image degradation first (HLLHGAN) (저해상도를 학습해서 화질개선 Gan을 학습하세요.) Keywords: Image and face super-resolution, Generative Adversarial Networks, GANs. [Abstract] super-resulution 연구의 핵심은 낮은 해상도의 이미지를 높은 해상도로 증가시키는 방법에 중점을 두고 개발되었고 학습에 필요한 데이터는 주로 인위적으로 흐리게하거나 간단하게 이차 다운샘플링에 의해 생성되었습니다. 그러나, 이 논문은 기존의 방법이 좋은 결과를 만들어내지 못함을 주장합니다. 즉, 고화질데이터셋을 통해 인위적으로 만들어진 저화질데이터셋으로 학습한 모델에 실제 이미지를 적용하면 성능이 떨어진다는 것입니다. 이 문제를 우회하기 위해 two-stage process를 제.. 2024. 1. 15.
Fast Nearest Convolution for Real-Time Effictient Image Super-Resolution[논문리뷰] Fast Nearest Convolution for Real-Time Effictient Image Super-Resolution (실시간 효율적 이미지 초고해상도를 위한 빠른 최근접 합성곱 기술) Keywords: Image super-resolution, real-time network, mobile device, nearest convolution, quantization [Abstract] 딥러닝 기반의 SISR(Single Image Super Resolution)은 많은 각광을 받았고 GPU를 사용하면서 놀랄만한 성취를 이뤘다. 그러나, 최신의 SOTA Model은 많은 파라미터 수, 메모리, 계산 자원을 요구하기 때문에(즉 무겁다. 그래서 느리다.), 보통 모바일 CPU/NPU 환경에서는 저.. 2024. 1. 10.
[논문리뷰] ESRGAN 논문: https://arxiv.org/abs/1809.00219 ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks The Super-Resolution Generative Adversarial Network (SRGAN) is a seminal work that is capable of generating realistic textures during single image super-resolution. However, the hallucinated details are often accompanied with unpleasant artifacts. To furth arxiv.org ESRGAN은 Enhanced Super-Resol.. 2024. 1. 3.
02 싱글톤 패턴 & 게으른 초기화 "게으른 개발자"의 유래 한국에서 익히 사용되는 개발 언어(?)이다. '긍정적인 의미'로는 일부 개발자들은 혁신적이고 효율적인 방법을 찾기 위해 노력하면서, 기술적인 문제를 해결하는 데 시간을 들이고 고민하는 모습을 기리는 것이다. 개발 작업에서 늘 새로운 방법과 해결책을 찾기 위해 고심하고 실험하는 과정에서 '게으름'이라는 말은 실제로 창의적인 사고와 혁신을 이끌어냈다는 관점에서 긍정적으로 받아들여진다. 반면, '부정적인 의미'로는 개발자들이 일을 귀찮아하거나 적극적으로 문제를 해결하지 않는다는 부정적인 해석으로도 사용될 수 있다. 이는 느슨하거나 무관심한 태도로 인해 일정을 맞추지 않거나 문제에 대처하지 않는 상황을 비판하는 의미로 사용될 수 있다. 게으른 초기화(Lazy instantiation):.. 2023. 12. 21.
02 싱글톤 디자인 패턴 싱글톤 디자인 패턴 개요 싱글톤 디자인 패턴은 글로벌하게 접근 가능한 하나의 객체를 제공하는 패턴이다. 싱글톤 디자인 패턴은 주로 하나의 인스턴스를 공유하여 로깅, 데이터베이스 관련 작업, 프린터 스풀러 등과 같은 동일한 리소스에 대한 동시 요청의 충돌을 방지하는데 사용된다. ex) 1) DB작업 수행 시 일관성 유지를 위해 하나의 데이터베이스 객체를 사용하는 경우 2) 로그를 기록하는 작업 시 여러 서비스의 로그를 하나의 로그 파일에 순차적으로 동일한 로깅 객체를 사용해 적제하는 경우 [싱글톤 디자인 패턴의 목적] 클래스에 대한 단일 객체 생성 전역 객체 제공 공유된 리소스에 대한 동시 접근 제어 위와 같은 다른 언어의 경우 생성자(Constructor)를 private로 선언하고 객체를 초기화하는 s.. 2023. 12. 18.
인공지능 대학원 및 스타트업 면접 예상 질문 H대 대학원 로지스틱 회귀란? 언제 로지스틱 회귀를 사용할 수 있을까? 로지스틱 회귀(Logistic Regression)는 이름은 회귀라고 붙어있지만, 실제로는 이진 분류(Binary Classification)를 위한 지도 학습 알고리즘입니다. 로지스틱 회귀는 선형 회귀와는 다르게 이진 분류를 위한 확률을 추정하는 모델로 사용됩니다. 로지스틱 회귀는 입력 특성의 가중치 합을 로지스틱 함수 또는 시그모이드 함수를 통과시켜 0과 1 사이의 값으로 변환하여 해당 클래스에 속할 확률을 추정합니다. 이를 통해 데이터를 분류합니다. 로지스틱 회귀는 다음과 같은 경우에 사용될 수 있습니다: 이진 분류 문제: 두 개의 클래스 중 하나를 예측하는 문제에서 사용됩니다. 예를 들어, 스팸 메일 여부, 질병 발병 여부 등.. 2023. 12. 16.
728x90
반응형