728x90
Microsoft COCO: Common Objects in Context, ECCV 2014
논문 참고,
https://arxiv.org/pdf/1405.0312.pdf
COCO dataset
COCO dataset은 여러 일상 이미지들의 집합이고, 2017년 공개된 데이터 셋 기준으로,
- train2017 (19G)
- val2017 (788M)
- test2017 (6.3G)
- annotations (808M)
의 데이터를 제공하고 있습니다.
또한 328,000 장의 이미지와, 250만개의 label이 있습니다.
COCO dataset은 여기에서 다운로드 가능합니다.
coco dataset download
Annotations
용도에 맞는 annotation을 가지고 있습니다.
그 종류로는
- Object detection
- Keypoint detection
- Stuff segmentation
- Panoptic segmentation
- Image captioning
이 있습니다.
1. Object detection
annotation{
"id" : int,
"image_id" : int,
"category_id" : int,
"segmentation" : RLE or [polygon],
"area" : float,
"bbox" : [x,y,width,height],
"iscrowd" : 0 or 1,
}
categories[{
"id" : int,
"name" : str,
"supercategory" : str,
}]
2. Keypoint Dectection
annotation{
"keypoints" : [x1,y1,v1,...],
"num_keypoints" : int,
"[cloned]" : ...,
}
categories[{
"keypoints" : [str],
"skeleton" : [edge],
"[cloned]" : ...,
}]
"[cloned]": denotes fields copied from object detection annotations defined above.
3. Stuff Segmentation
일부(iscrowd)만 제외하고, object detection 과 양식이 같습니다.
4. Panoptic Segmentation
annotation{
"image_id" : int, "file_name" : str, "segments_info" : [segment_info],
}
segment_info{
"id" : int,. "category_id" : int, "area" : int, "bbox" : [x,y,width,height], "iscrowd" : 0 or 1,
}
categories[{
"id" : int, "name" : str, "supercategory" : str, "isthing" : 0 or 1, "color" : [R,G,B],
}]
5. Image Captioning
annotation{
"id" : int, "image_id" : int, "caption" : str,
}
728x90
댓글