태그 보관물: Spark

Recommendations with DSSTNE

아마존이 공개한 딥러닝 라이브러리인 데스트니(DSSTNE)와 아파치 스파크(Spark)를 이용한 추천 시스템을 구성하는 방법에 대해 아마존 개발자 Kiuk Chung이 빅데이터 블로그에 ‘Generating Recommendations at Amazon Scale with Apache Spark and Amazon DSSTNE‘ 글을 올렸습니다. 자세히 읽어보진 못했지만 추천 시스템 쪽에선 좋은 참고가 되지 않을까 생각합니다. 아마존이 라이브러리를 공개하고 나서 조금씩이라도 커뮤니티를 위해 알리는 노력을 하는 것 같아 반갑습니다.

Large Scale Deep Learning with TensorFlow by Jeff Dean

스파크 서밋 2016에서 제프 딘(Jeff Dean)이 발표한 키노트 ‘Large Scale Deep Learning with TensorFlow’ 동영상이 공개되었습니다. 슬라이드 자료는 여기에서 받으실 수 있습니다.

스파크 서밋 2016의 또 다른 키노트 발표자인 앤드류 응(Andrew Ng)의 ‘AI: The New Electricity’도 참고하세요.

때마침 edX에서 버클리 대학교의 스파크 시리즈 강좌가 시작되었네요. 특별히 Certificate를 받을 필요가 없다면 무료이며 모든 강좌에 똑같이 참여할 수 있습니다.

데이터 엔지니어링 에코시스템

Insight Data Science 에서 데이터 엔지니어링 에코시스템 을 새로 발표하였습니다.

스크린샷 2015-12-04 오후 11.52.26

이 맵은 데이터 사이언스 분야의 관심 기술들을 한눈에 조망할 수 있고 인터렉티브 맵으로 만들어져 있어서 마우스를 올리면 간단한 소개와 공식 사이트로 링크를 제공하고 있습니다.

금번에 새로운 트렌드로는 메모리 가격이 낮아지면서 인메모리 데이터베이스와 관련된 새로운 제품들이 많이 생겼다는 것과 스파크(Spark) 보다 스트리밍 데이터 처리에 보다 좋은 성능을 발휘하는 플링크(Flink)가 빠르게 퍼지고 있다는 것 입니다.

혹 이 맵에서 낯설은 단어들이 보이신다면 시간을 갖고 천천히 둘러보시길 추천합니다.