FMA: A Dataset For Music Analysis

다양한 음악 관련 연구에 사용할 수 있는 새로운 데이터셋 FMA가 공개되었습니다. 이 데이터셋은 68개의 장르에 걸쳐 77,643개의 노래에서 30초씩 샘플링한 mp3 파일입니다. 음악 데이터의 소스는 FMA(Free Music Archive)가 보유한 8만개가 넘는 음악 중에 최소한 100개 이상의 샘플을 가진 장르만을 선택했습니다. 데이터는 노래의 중간 부분 30초를  44,100Hz, 128kb/s, 스테레오로 샘플링했습니다. The Million Song Dataset 보다 노래의 개수는 적지만 전처리 되지 않은 원본 오디오 데이터라는 점을 강조하고 있습니다. 데이터를 다운 받는 방법과 사용법에 대한 깃허브를 참고하세요.

이 데이터셋은 세가지로 나뉘어져 있습니다. 77,643개의 노래를 모두 샘플링한 fma_large.zip(약 90기가)은 곧 공개될 예정이라고 합니다. 20개의 장르에서 14,511개의 노래를 샘플링한 fma_medium.zip(약 12기가) 과 10개의 장르에서 동일하게 400개씩 샘플링한 fma_small.zip(약 3기가)은 바로 다운받을 수 있습니다. 다운 받은 폴더에는 json 파일이 샘플링한 노래에 대한 아티스트, 제목, 장르, 재생횟수 등의 메타 데이터를 가지고 있습니다. 간단한 사용법을 보여주는 주피터 노트북에 메타 데이터에 대해 자세히 나와 있습니다.

머신 러닝이나 딥러닝을 위한 이미지 데이터셋으로는 ImageNet이 널리 사용되고 있는데 반해 음악쪽의 데이터는 여러 제약사항이 많아 이 데이터셋을 만들게 되었다고 합니다. 이 데이터셋의 페이퍼(1612.01840)에서 데이터에 대한 자세한 설명과 다른 음악 데이터셋들을 간단하게 요약하고 있습니다.

댓글 남기기

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.