본문 바로가기
ML, DL/data

COCO dataset

by Wordbe 2019. 7. 23.
728x90

Microsoft COCO: Common Objects in Context, ECCV 2014

논문 참고,

https://arxiv.org/pdf/1405.0312.pdf

COCO dataset

COCO dataset은 여러 일상 이미지들의 집합이고, 2017년 공개된 데이터 셋 기준으로,

  • train2017 (19G)
  • val2017 (788M)
  • test2017 (6.3G)
  • annotations (808M)
    의 데이터를 제공하고 있습니다.
    또한 328,000 장의 이미지와, 250만개의 label이 있습니다.

COCO dataset은 여기에서 다운로드 가능합니다.
coco dataset download

Annotations

용도에 맞는 annotation을 가지고 있습니다.

그 종류로는

  • Object detection
  • Keypoint detection
  • Stuff segmentation
  • Panoptic segmentation
  • Image captioning

이 있습니다.

1. Object detection

annotation{
"id" : int, 
"image_id" : int, 
"category_id" : int, 
"segmentation" : RLE or [polygon], 
"area" : float, 
"bbox" : [x,y,width,height], 
"iscrowd" : 0 or 1,
}

categories[{
"id" : int, 
"name" : str, 
"supercategory" : str,
}]

2. Keypoint Dectection

annotation{
"keypoints" : [x1,y1,v1,...], 
"num_keypoints" : int, 
"[cloned]" : ...,
}

categories[{
"keypoints" : [str], 
"skeleton" : [edge], 
"[cloned]" : ...,
}]

"[cloned]": denotes fields copied from object detection annotations defined above.

3. Stuff Segmentation

일부(iscrowd)만 제외하고, object detection 과 양식이 같습니다.

4. Panoptic Segmentation



annotation{
"image_id" : int, "file_name" : str, "segments_info" : [segment_info],
}

segment_info{
"id" : int,. "category_id" : int, "area" : int, "bbox" : [x,y,width,height], "iscrowd" : 0 or 1,
}

categories[{
"id" : int, "name" : str, "supercategory" : str, "isthing" : 0 or 1, "color" : [R,G,B],
}]

5. Image Captioning



annotation{
"id" : int, "image_id" : int, "caption" : str,
}
728x90

댓글