이번 포스트에서는 다양한 Computer Vision task에서 사용되는 데이터셋들에 대하여 살펴보도록 하겠다.



COCO


paper: Tsung-Yi Lin Et al.(2015), Microsoft COCO: Common Objects in Context

COCO는 Common Object in Context의 줄임말로서, object detection, keypoint detection, stuff segmentation, panoptic segmentation, image captioning을 위한 데이터셋이다.

Microsoft의 COCO Dataset은 약 33만개의 데이터로 구성되어 있으며, 여러 버전에 걸쳐 공개되었다.

MS COCO paper에는 91개의 class라고 명시되어 있지만, 실제로는 80개의 class가 제공된다.



Pascal VOC


paper: Mark Everingham, Luc Van Gool, Christopher K. I. Williams, John Winn(2010), Andrew ZissermanThe PASCAL Visual Object Classes (VOC) Challenge

Pascal VOC는 object detection을 위한 데이터셋이다.

2005년부터 2012년까지 열린 Pascal VOC Challenge에서 사용된 데이터셋이다. Pascal VOC Challenge는 현재는 더이상 진행되지 않는 대회이지만, Pascal VOC data는 여전히 많이 사용되고 있는 데이터셋이다.

대회는 종료되었지만 여전히 PASCAL VOC Evaluation Server에서 Pascal VOC 데이터셋에 대한 evaluation 결과 현황를 확인할 수 있다.



Reference

COCO

The PASCAL Visual Object Classes Homepage