본문 바로가기

ML, DL/논문8

[GAN for Data Augmentation] DAGAN, 2018 DAGAN, 2018 Antreas Antoniou et al., arXiv [stat.ML], 2018 Data Augmentation GAN Abstract (문제) Data augmentation은 모델의 일반화에 기여하는 좋은 수단이지만, 기존의 Data augmentation 은 그럴듯한 대체 데이터에 한정되어 데이터를 증식했다. (단순 선형 변환 등) (해결) DAGAN을 이용하면, 한 소스 도메인으로 부터 다른 클래스의 데이터를 생성해낼 수 있다. 데이터를 생성함에 있어 클래스에 구애받지 않기 때문에, 보지 못했던 클래스에도 적용할 수 있다. 또한, Matching Networks 같은 few-shot learning에 DAGAN을 적용함으로써, 다양한 데이터들에 대해 성능 향상을 할 수 있.. 2019. 10. 5.
[GAN] Data Augmentation Using GANs, 2019 Data Augmentation Using GANs FHKS Tanaka, arXiv cs.LG, 2019/04/19 Abstract GAN은 데이터 증식을 위해 쓰일 수 있다. 1) 클래스가 불균형한 데이터셋에서 부족한 클래스를 보충하기 위해, 2) 데이터가 privacy에 관련한 민감한 정보를 포함할 때, 합성이미지로 이를 극복한다. 본 논문은, Generator로 저자가 직접구현한 간단한 모델을 이용하고, Discriminator로는 Decision Tree를 이용하여 GAN으로 만든 합성 데이터가 실제 데이터를 대체할 수 있을지 연구한 결과이다. 1. Introduction Good 데이터 셋을 가지는 것은 모델의 학습을 위해 참 중요한 요소이다. 1) Imbalanced 데이터에서, oversa.. 2019. 9. 21.
Grad-CAM(Gradient-weighted Class Activation Mapping), 코드포함 Visual Explanations from Deep Networks via Gradient-based Localization Ramprasaath et al, Virginia Tech, Georgia Institute of Technology, 2017 Abstract CAM(Class Activation Mapping)은 CNN 기반 네트워크에서 많은 클래스를 결정할 때, 시각적인 설명을 제공합니다. 여기서 말하는 Grad-CAM(Gradient-weighted CAM)은 CAM을 구할 때, "예측 이미지안의 중요한 부분을 강조하는 대략적인 지역 맵을 생산하기위한 마지막 컨볼루션 층으로 흘러가는", "타겟 클래스(캡션, 마스크도 가능)에 대한" gradient를 이용합니다. 따라서 적용할 수 있는 범.. 2019. 8. 8.
Faster R-CNN, 2016 Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun Abstract 이 모델에서는 full 이미지 convolutional feature와 detection 네트워크를 공유하는 Region Proposal Network (RPN)를 도입합니다. 즉, RPN은 fully convolutional network이고, 객체의 bound와 점수를 동시에 예측하게 됩니다. Faster R-CNN은 RPN과 Fast R-CNN을 하나의 네트워크로 합쳤습니다. 또한 Attention 메카니즘을 적용함으로써, RPN은 어디를 보아야 할지 알려주는 통합된 네트워크입니다. 그 결과 ILSVRC과 COCO 2015 competition에서 높은 정확도로 우승을 하게 되었습니다. .. 2019. 8. 6.
Cascade R-CNN, Cai et al, 2018 0. Abstract 객체 탐색(object detection)에서, IoU(intersection over union) 임계값(thresold)는 양수나 음수로 정의되어야 합니다. 하지만, 디텍터 성능은 IoU thresold가 증가함에 따라 감소하는 양상을 보입니다. 두 가지 주요 원인이 있는데, 1) 지수적으로 양의 샘플(positive sample)이 사라지기 때문에 나타나는, 훈련 중에서의 과대적합(overfitting)현상입니다. 2) 디텍터가 최적이되는 IoU와 입력 가설 IoU 사이의 inference-time mismatch가 생기기 때문입니다. 다단계(multi-stage) 객체 탐색 구조인 Cascade R-CNN은 위 두 문제를 다룹니다. Cascade R-CNN은 순차적으로 clo.. 2019. 8. 4.
[MMDetection] 논문 정리 및 모델 구현 Abstract MMDetection은, object detection과 instance segmentation을 다루는 유명하고 다양한 모델을 하나의 toolbox로 구현한 일종의 플랫폼이다. 많은 사람들이 사용하여, 기존 디텍션 모델을 다양한 분야에 응용하고, 새로운 모델을 만드는데 도움이 되었으면 한다고 한다. 소스 코드, pytorch로 작성되어 있다 https://github.com/open-mmlab/mmdetection 1. Introduction 주요 특징은 크게 네가지이다. 1) Modular design 모델이 모듈화 되어있어 사용자 제작이 간편하다. 2) Supported Framwork 독창적으로 여러 프레임워크를 지원한다. 2번 본문 참고 3) High efficiency 모든 b.. 2019. 7. 28.
The Open Images Dataset V4, Kuznetsova, Google AI, 2018 Abstract 9.2M 개의 이미지 19.8k개의 concept에 대한 3천10만개의 이미지-레벨 레이블 600개의 object class에 대한 1천5백4십만개의 bounding box 57개의 class에 대한 visual relationship 표기가 3십만7500개 이다. 이 데이터들은 image classification, object detection, visual relationship detection 영역의 발전에 사용되기를 바라고 있다. 1. Introduction 이미지 소개 2. Dataset Acquisition and Annotation 2.1 Image Acquisition 2.2 Classes 2.3 Image-Level Lables 이미지를 분류하는 것은 시간도 많이 걸리.. 2019. 7. 18.
Mask-RCNN Facebok AI Research (FAIR), Kaiming He, 24 Jan 2018 Marr Prize at ICCV 2017 Abstract object instance segmentation 을 위한 프레임워크. 학습이 쉽고 Faster R-CNN에 조금의 overhead만 추가해서 5 fps의 빠르기 정도로 실행된다. COCO 셋에서 instance segmentation, bbox object detection, person keypoint detection 에서 가장 높은 결과를 보였다. 1. Introduction instance segmentation은 두 가지 과제를 합친 것이다. object detection : bbox를 이용하여 object를 분류하고, 위치를 찾는 것. se.. 2019. 7. 16.
728x90