바이두에서 새로운 딥러닝 프레임워크를 오픈소스로 공개하였습니다. 이 프레임워크의 이름은 패들패들(PaddlePaddle)로 ‘PArallel Distributed Deep LEarning’의 앞자리를 따왔습니다. 올해 초에 바이두에서 공개한 프레임워크가 있었지만 범용적인 프레임워크라고 보기는 어렵습니다. 이번에 발표한 패들(PaddlePaddle)이 본격적인 바이두의 딥러닝 프레임워크라고 보여집니다.
패들(PaddlePaddle)은 C++로 작성되었고 파이썬 인터페이스를 가지고 있습니다. 수학 연산의 성능과 분산환경 그리고 순환 신경망에 대해 최적화를 했다고 언급하고 있습니다. 텐서플로우가 그랬듯이 패들(PaddlePaddle)을 개발을 하면서 바이두의 여러 제품에 이미 널리 적용하고 있는 것 같습니다.
패들(PaddlePaddle)의 공식 페이지는 ‘www.paddlepaddle.org‘ 이고 9월 1일에 오픈이 될 예정입니다. 아마도 9월 1일에 열리는 바이두 월드(http://baiduworld.baidu.com/)에 맞추어 대대적인 홍보를 할 것 같습니다. 패들(PaddlePaddle) 문서는 여기에서 보실 수 있습니다. 문서에 포함되어 있는 이미지 분류 예에서 파이썬 인터페이스를 이용하여 뉴럴 네트워크 설정을 하고 커맨드라인에서 paddle
명령으로 학습시키는 것을 엿볼 수 있습니다. 텐서플로우의 InteractiveSession 같은 기능을 기대하거나 쥬피터 노트북(Jupyter Notebook)을 활용하기는 다소 어려울 것 같습니다.
패들(PaddlePaddle)이 바이두에서 만든 것이고 충분한 문서가 중국어로 제공될 수 있기 때문에 중국내에서는 쉽게 사용자층을 확보할 수 있을 것 같습니다. 그리고 실리콘밸리에 있는 앤드류 응(Andrew Ng)의 바이두 리서치가 패들(PaddlePaddle)의 미국내 보급에 어떤 역할을 할지 궁금합니다.
텐서플로우(TensorFlow), 씨아노(Theano), 토치(Torch), 카페(Caffe), CNTK, 데스트니(DSSTNE)에 이어서 패들(PaddlePaddle)까지! 이제 웹브라우저 종류보다도 많아진 것 같습니다. 🙂
(업데이트) 패들의 홈페이지가 정식으로 오픈되었고 바이두 월드 컨퍼런스도 시작되었습니다. 컨퍼런스 기조 연설 동영상 후반부에 앤드류 응(Andrew Ng)의 발표가 있습니다. 이 동영상의 1시간 52분 57초 정도에 짧지만 패들에 대한 소개가 있습니다. 중국어라서 전혀 알아들을 수는 없지만 슬라이드 자료의 한자를 이용해 추측해 보면 주요 서드파티 라이브러리(아마도 텐서플로우가 아닐까 생각됩니다)보다 데이터 전처리와 훈련, 그리고 추론에 드는 코드의 양이 각각 1/5, 1/3, 1/5 로 적게 든다고 언급하는 것 같습니다.(혹 중국어를 잘 아시는 분 계시면 댓글 부탁 드립니다)
(업데이트) 구글과 아마존에서 일했던 AI 과학자 델립 라오(Delip Rao)에게 우연히 물어봤는데 정확하게 한자를 해석해 주었습니다. 왼쪽의 세 문장은 위에서 부터 ‘Sequence model preparation’, ‘Sequence model training’ 그리고 ‘Image classification model’ 이라고 합니다. 맨 위 컬럼에 쓰인 문장은 예상대로 ‘Major third party platform’ 입니다. 하지만 텐서플로우를 의미하는 것인지는 확실하지 않다록 하네요. 그도 앤드류 응이 코드 라인수를 장점으로 발표하는 게 의아하게 생각되는 모양입니다.