구글이 작년 가을에 공개한 YouTube-8M 데이터셋에 이어 이번에는 YouTube-BoundingBoxes 데이터셋을 공개하였습니다. 화면에 어떤 오브젝트가 있는지를 알아내는 것뿐만 아니라 오브젝트가 어디로 이동하고 있는지 시간에 따라 어떤 변화를 가지는지 연구하기 위한 데이터셋입니다. 무려 24만개 동영상에서 23개 오브젝트에 대해 백만개 이상의 사각 영역 좌표를 표시해 놓았습니다. 사람이 처리한 동영상 데이터셋으로는 최대라고 합니다. 브라우저로 데이터셋을 둘러 볼 수 있으며 동영상의 유투브 아이디와 오브젝트 좌표, 나타난 시간이 담겨 있는 훈련/검증 데이터를 다운받을 수 있습니다. 관련 페이퍼도 참고하세요. 그런데 다른 오브젝트는 그렇다쳐도 toilet 데이터는 왜 만든 걸까요? 🙂
YouTube-BB Datasets
댓글 남기기