Tag Archives: DMTK

마이크로소프트(Microsoft), 바이두(Baidu)도 딥러닝 프레임워크를 오픈소스로 공개했다.

작년 말에 마이크로소프트가 머신러닝 툴킷 DMTK를 공개하였습니다.

https://tensorflowkorea.wordpress.com/2015/11/16/마이크로소프트-머신러닝-툴킷-dmtk-오픈소스로-배포/

이에 이어 딥러닝 프레임워크 CNTK(Computational Network Toolkit)를 오픈 소스로 공개하였습니다. CNTK는 마이크로소프트가 코타나(Cortana)나 Skype 번역 어플리케이션에 사용하는 인공신경망 알고리즘 프레임워크로 구글의 텐서플로우(TensorFlow)에 대응하는 제품이라고 볼 수 있습니다.

http://www.wired.com/2016/01/microsoft-tries-to-one-up-google-in-the-open-source-ai-race/

놀라운 것은 CNTK 가 구글의 텐서플로우와는 다르게 완전 무료라는 점 입니다. 수정, 복사는 물론 재배포, 판매까지 상업적이던 아니던 아무런 제약없이 사용할 수 있습니다. 사실 구글의 텐서플로우를 상업적 목적으로 사용하기에는 라이센스에 제약이 있다는 점을 잘 파고든 것 같습니다.

https://github.com/Microsoft/CNTK

마이크로소프트 과학자의 말을 인용하면 구글이 공개한 텐서플로우 버전을 여러개의 머신에서 병렬로 딥러닝을 수행하기에는 부족하다고 합니다. 토치(Torch) 프레임워크를 제외하고는 CNTK가 거의 유일한 대규모의 인공신경망 분석을 할 수 있는 완제품 이라고 합니다. 현재는 C++ 만을 지원하지만 곧 Python 을 지원할 계획이라고 합니다.

또 불과 일주일 전에는 중국의 최대 검색엔진인 바이두(Baidu)의 AI 랩에서 Warp-CTC(Connectionist Temporal Classification) 라는 CTC 교사학습(Supervisored Learning) 알고리즘을 구현한 소프트웨어를 공개하였습니다.

https://github.com/baidu-research/warp-ctc

2년전 구글의 딥러닝 프로젝트를 이끌던 스탠포드 대학교의 앤드류응(Andrew Ng) 교수가 바이두 AI 랩 수장으로 옮긴 일이 화제가 되기도 했었습니다. 아마도 바이두는 머신러닝 주도권 싸움이 구글과 마이크로소프트간의 경쟁으로만 남게 두지는 않을 것 같습니다.

자 다음에는 누구 차례일까요? 아마도 페이스북이 아닐까 합니다. 물론 딥러닝을 위한 GPU 기반의 하드웨어 설계를 공개했지만 구글과 마이크로소프트에 비하면 조금 밀리는 것 같습니다. 언젠가 페이스북이 발표할 그 무엇을 기대해 봅니다.

마이크로소프트 R 분석서버 무료공개

마이크로소프트가 머신러닝 프레임워크 DMTK 를 오픈소스로 공개한 이후 또 다른 툴을 공개했습니다. 바로 R 분석 서버의 무료 버전을 제공합니다.

revolutionbecomesrserver

http://www.zdnet.com/article/microsoft-delivers-free-version-of-its-r-analytics-server-for-developers/

마이크로소프트는 작년 초 레볼루션 어낼리틱스(http://www.revolutionanalytics.com)사를 인수했습니다. 이 회사의 ‘레볼루션 R 엔터프라이즈’를 ‘마이크로소프트 R 서버’로 ‘레볼루션 R 오픈’을 ‘마이크로소프트 R 오픈’으로 재단장하여 공개했습니다. ‘마이크로소프트 R 서버’의 개발자 버전은 무료로 제공되며 상용 버전과 완전히 동일한 기능을 가지고 있습니다. 비주얼스튜디오  프로그램 계정(https://www.visualstudio.com/en-us/products/visual-studio-dev-essentials-vs.aspx)을 가지고 아래 링크에서 다운 받을 수 있습니다.

https://www.microsoft.com/en-us/server-cloud/products/r-server/

마이크로소프트는 R 과 Azure 클라우드와의 통합을 계속 강화한다고 합니다. 아마도 마이크로소프트의 머신러닝 언어로는 R이 중요한 위치로 자리잡을 것으로 보이며 R을 사용하는 개발자나 데이터 과학자들에게는 즐거운 소식이 아닐 수 없습니다.

머신 러닝 타임즈 2015

2015년은 머신러닝의 해라고 불릴만큼 머신러닝 기술이 많이 회자되고 큰 회사부터 스타트업까지 많은 기사를 토해낸 한 해였습니다. 어낼리틱스 비댜(Analytics Vidhya)에서는 2015년 중요한 머신러닝 이슈들을 한 곳에 모아서 발표하였습니다.

눈에 띄이는 2015년 이슈는 무엇이 있을까요? 페이스북이 토치(Torch)를 이용한 툴들을 공개했고 다토(Dato)가 본격적으로 머신러닝 시장에 참여하기 시작했습니다. 다토는 제 1의 Mooc 사이트인 코세라(Cousera)에도 머신러닝 강의를 올해부터 시작했습니다. 마이크로소프트가 머시러닝 툴킷 DMTK를 오픈소스로 공개하고 자사의 클라우드인 아주르(Azure)에 머신러닝 플랫폼을 런칭했습니다. 또 유명한 Mooc인 유다시티(Udacity)에도 머신러닝과 데이터사이언스에 관한 강좌를 제공하고 있습니다. 애플이 지속적으로 머신러닝 인재를 영입하고 관련 회사들을 사들이는 기사도 보도되었습니다. 머신러닝과는 직접 관계는 없지만 스위프트(Swift) 언어를 오픈소스로 공개한 것도 올해 입니다.

Continue reading

마이크로소프트 머신러닝 툴킷 DMTK 오픈소스로 배포

구글에 이어 마이크로소프트까지 머신러닝 오픈소스화에 뛰어 들었습니다. 구글, 페이스북이 주도하는 머신러닝 커뮤니티에 뒤지지 않으려는 행보같습니다. 사실 윈도우즈 환경에서는 대표할 만한 머신러닝 툴킷이 없는 것도 사실입니다. 파이썬이나 R 같은 대표적인 도구들은 윈도우즈 보다는 오히려 맥이나 리눅스에서 더 잘 돌아가는 것 같거든요.

마이크로소프트 입장에서는 클라우드 Azure 를 생각해서라도 머신러닝 생태계를 좌시할 수만은 없었을 것 같습니다. DMTK는 Distributed Machine Learning Toolkit 의 약자입니다. 서버와 클라이언트로 구성이 되어 있으며 C++ 로 개발되어 있습니다. 자동 설치 배포판은 아직 존재하지 않으며 윈도우즈에서는 비주얼 스튜디오로 그리고 리눅스에서는 make 명령으로 컴파일 할 수 있도록 안내하고 있습니다. 아직 맥 환경은 제공하지 않는 듯 합니다.