태그 보관물: Machine Learning

SciPy 2017

파이썬 과학 컴퓨팅 컨퍼런스인 SciPy 2017이 텍사스주 오스틴에서 지난 10~16일에 열렸습니다. 올해에도 풍성한 토크튜토리얼 동영상이 유투브에 공개되었습니다. 이 중에 눈에 띄는 몇 개를 골라 보았습니다.

이 외에도 다양한 주제에 대한 여러 동영상이 많이 올라와 있습니다. 전체 리스트를 확인해 보세요.

홍대 머신러닝 스터디 모집합니다. ^^

홍대 근처에 머신러닝에 관심있는 사람들과 함께 공부할 수 있는 자그마한 스터디 모임을 만들려고 합니다. 이 모임의 첫 목표는 “파이썬 라이브러리를 활용한 머신러닝” 도서를 완주하는 것으로 삼았습니다. 참여에는 아무런 조건도 필요치 않습니다. 자세한 내용은 밋업 이벤트를 참고해 주세요. 🙂

Hongdae Machine Learning Study

Seoul, KR
5 Members

홍대 근처에서 머신러닝을 공부하는 모든 분들을 환영합니다. 이 스터디 그룹에서는 “파이썬 라이브러리를 활용한 머신러닝”(한빛미디어, 2017)을 완주하기 위해 자료를 준비하고 있습니다. 함께 공부하고 이야기를 나누고 싶은 모든 분들에게 열려 있습니다.자격 조건: 남녀노소 또는 LGBT, 한국어 능통. 지켜야할 …

Next Meetup

“파이썬 라이브러리를 활용한 머신러닝”의 1장 소개, 2장 지도 학습

Tuesday, Jul 25, 2017, 7:00 PM
1 Attending

Check out this Meetup Group →

 

‘파이썬 라이브러리를 활용한 머신러닝’ 출간

b6119391002_lscikit-learn의 코어 개발자이자 배포 관리자인 안드레아스 뮐러Andreas Mueller와 매쉬어블의 데이터 과학자인 세라 가이도Sarah Guido가 쓴 ‘Introduction to Machine Learning with Python‘를 번역한 ‘파이썬 라이브러리를 활용한 머신러닝‘을 출간하였습니다.

출간 직전에 원서가 새로 릴리즈되어서 한바탕 소동을 벌이기는 등 이런 저런 일들이 오랜 작업 기간동안 생겼던 것 같습니다. 추운 겨울에 시작한 일을 한 여름이 되어서야 내놓게 되었네요. 책은 출간이 새로운 시작인 것 같습니다. 에러타나 궁금한 점 등 어떤 이야기도 괜찮습니다. 도서 페이지에 있는 양식을 통해 자유롭게 보내 주세요.

그리고 혹, 서점에 가시면 잘 보이는 곳으로 옮겨놔 주세요! 🙂

(업데이트) 번역서의 1장, 2장 전체를 블로그에 공개할 예정입니다. 공개를 허락해 주신 한빛미디어에 깊이 감사드립니다. 원고를 정리해서 올릴려면 1주일 정도 걸릴 것 같습니다. 😀

PyCon 2017

스크린샷 2017-05-22 오후 12.01.28

지난 주 캘리포니아 구글 마운틴뷰에서 구글 IO 2017이 열렸습니다. 많은 사람들의 관심이 구글 IO에 집중될 때 바로 그 위 오레건 주에서는 파이콘 2017이 같이 시작됐습니다. ^^ 파이콘이 구글 IO처럼 라이브 스트림되지는 못하지만 벌써 유투브에 튜토리얼과 토크 동영상이 올라왔습니다! 파이콘 유투브 채널에서 데이터 사이언스와 관련있는 것을 추려 보았습니다. (파이콘 코리아 2017도 8월에 열립니다)

[Review] ML with TensorFlow

title매닝Manning 출판사의 텐서플로우 책인 “Machine Learning with TensorFlow“가 거의 원고를 마무리하고 곧 출간될 예정입니다. 이 책의 최신 MEAP 버전을 바탕으로 간략히 리뷰를 작성합니다.

이 책은 텐서플로우를 이용하여 머신 러닝 알고리즘을 작성하는 챕터들로 구성되어 있습니다. 머신 러닝의 관점에서도 텐서플로우의 관점에서도 모두 입문서에 해당합니다. 크게 세가지 파트로 나뉘어져 있으면 첫 번째는 머신 러닝과 텐서플로우의 소개, 두 번째 파트는 회귀, 분류, 군집, 히든 마코브Hidden Markov 모델을 소개합니다. 마지막 세 번째 파트에서는 오토인코더autoencoder, 강화 학습, CNN, RNN을 다룹니다.

1장에서 대부분의 다른 책들 처럼 머신 러닝에 대한 개괄적인 소개를 하고 있습니다. 모델, 파라미터, 학습, 추론(여기서 말하는 추론은 통계의 추론이 아니고 머신 러닝의 예측을 말합니다), 특성 등을 포함합니다. 그리고 L1, L2 노름을 포함하여 일반화된 노름norm에 대해서 잘 설명하고 있습니다. 그리고 세가지의 큰 머신 러닝 분류인 지도 학습, 비지도 학습, 강화 학습을 사례를 들어 차이를 설명합니다. 씨아노Theano, 토치Torch, 카페Caffe에 대해 간략히 소개하고 텐서플로우를 사용하려는 이유와 소개를 합니다. 그런데 scikit-learn이 비교적 저수준(?) 라이브러리이기 때문에 텐서플로우 같은 고수준(?) 라이브러리를 쓴다는 말이 좀 어색하네요. 이 챕터의 마지막에는 책 전체에서 챕터별로 각각 어떤 알고리즘들을 다룰 것인지를 그림과 표로 요약해서 보여주고 있습니다. 이런 정리는 책의 전체 내용을 쉽게 파악하게 도와주므로 아주 좋은 것 같습니다.

계속 읽기

Model evaluation, selection and algorithm selection

아래 글은 파이썬 머신 러닝의 저자 세바스찬 라쉬카(Sebastian Raschka)의 블로그인 “Model evaluation, model selection, and algorithm selection in machine learning“를 저자의 동의하에 번역한 것입니다. 전체 포스트는 4편으로 연재될 예정이었지만 현재 3편까지 쓰여졌습니다. 첫 번째 글은 성능추정에 대한 전반적인 소개와 홀드아웃 방법, 신뢰구간 등을 이항분포를 예로 들어 설명합니다. 두 번째 글은 반복적인 홀드아웃 방법과 부트스트래핑 방식을 설명합니다. 세 번째 포스트는 하이퍼파라미터 튜닝을 위한 홀드아웃 방법과 크로스밸리데이션, 모델 선택에 대해 설명합니다.

  1. 머신 러닝의 모델 평가와 모델 선택, 알고리즘 선택 – 1장. 기초
  2. 머신 러닝의 모델 평가와 모델 선택, 알고리즘 선택 – 2장. 부트스트래핑과 불확실성
  3. 머신 러닝의 모델 평가와 모델 선택, 알고리즘 선택 – 3장. 크로스밸리데이션과 하이퍼파라미터 튜닝

카이스트 머신러닝 워크샵 강의 동영상

지난 8월 22~23일에 열린 카이스트 머신러닝 워크샵에서 1일차와 2일차에 각각 한시간씩 진행된 동영상 강의가 유튜브에 공개되었습니다. 첫째날 강의는 ‘Introduction to Machine Learning’ 입니다. 둘째날 영상도 공개되면 업데이트 하겠습니다.

PhD level ML Courses

레딧(Reddit)에 머신러닝 코스 중 난이도가 높은 코스를 리스팅해 놓은 이 올라왔습니다. 좋은 코스들이 정리되어 있는 것 같아 공유합니다.

추가적으로 Edx에서 칼텍의 유명한 머신러닝 강좌인 ‘Learning from Data‘가 9월 18일 부터 시작됩니다!

카이스트 대학의 머신러닝 오픈 코스

kooc-ml

카이스트 대학교에서 만든 온라인 강의 사이트 KOOC에서 문일철 교수의 인공지능 및 기계학습 개론 1, 2 강좌가 시작되었습니다(강좌 페이지의 URL이 RESTful 하지 않아 프레임안의 링크를 연결하여 놓았습니다. 혹 접속에 문제가 될 경우는 kooc.kaist.ac.kr 로 접속하세요). 강의는 차례대로 업로드 되는 것 같습니다. 강의 초반에 확률에 대한 소개를 하고 있어 엔지니어 입장에서는 다소 거리감이 느껴질 수 있습니다(이 강의는 통계적 머신러닝-Statistical Machine Learning-에 가까운 것 같습니다).

머신러닝에 관해 처음 접하는 경우가 아니라면 동시에 1, 2 강좌를 수강해도 좋을 것 같습니다. 전체 강의 목차는 아래와 같습니다.

  1. Motivations and Basics
  2. Fundamentals of Machine Learning
  3. Naïve Bayes Classifier
  4. Logistic Regression
  5. Support Vector Machine
  6. Training/Testing and Regulatization
  7. Bayesian Network
  8. K-Means Clustering and Gaussian Mixture Model
  9. Hidden Markov Model
  10. Sampling Based Inference

국내에서 쉽게 만나기 어려운 좋은 강좌인 것 같습니다. 개인에 따라서는 1.5배속으로 정주행도 가능합니다. 다만 코세라(Coursera)나 Edx 와 비교하기는 아직 어렵습니다.

AI == Deep Learning?

딥러닝(Deep Learning)은 인공지능(Artificial Intelligence)과 같은 건가요? 라고 누가 묻는다면 조금 멈칫거릴 것 같습니다. 두 단어를 모두 많이 쓰기도 하고 듣기도 했지만 차이에 대해선 깊에 생각해 본적이 없었던 것 같습니다. 아마도 다른 사람들도 이를 혼용해서 부르거나 각기 나름대로 구분해서 생각할 것 같은데요. KD너겟(KDnuggets)에서 이와 관련된 글이(Is “Artificial Intelligence” Dead? Long Live Deep Learning?!?) 실렸습니다. 페드로 도밍고스(Pedro Domingos) 교수를 비롯해서 7명의 전문가에게 나름대로 두 단어의 정의를 부탁했습니다.

ai-ml-dl

출처: KD너겟 홈페이지

사람마다 조금씩 바라보는 시각이 다르지만 대체적으로 큰 틀에서는 딥러닝은 머신러닝(Machine Learning)의 부분 집합이며 인공지능은 머신러닝을 포괄하는 큰 의미로 생각하고 있습니다. 따라서 딥러닝은 인공지능의 동의어도 아니고 인공지능을 대체하는 개념도 아닙니다. 최근의 성과에 힘입어 미디어에서 딥러닝과 인공지능을 혼용하여 사용하지만 딥러닝은 딥 뉴럴 네트워크(Deep Neural Networks)를 사용한 머신러닝의 한 분야입니다.

딥러닝이 주로 인공지능 분야에 활용되고 있지만 인공지능은 딥러닝 이외에도 강화학습(reinforcement learning), 몬테카를로 트리탐색(Monte Carlo tree search), 유전자 알고리즘(Genetic algorithm) 등과 같은 기술이 함께 사용되고 있다는 점을 설명하고 있습니다. 인공지능은 또 머신러닝과 상관없는 문제해결(Problem Solving), 검색(Search), 지식표현(Knowledge Representation) 등 많은 다른 분야와 연관되어 있다는 점을 페드로 도밍고스 교수가 지적하고 있습니다.

그는 딥러닝은 특별히 이미지(비전), 텍스트(언어), 음성 등의 분야에서 주로 사용되고 있으며 구조화 되지 않은 입력 데이터를 이용해서 예측을 하는 데는 여전히 일반적인 머신러닝 알고리즘인 앙상블(Ensemble) 메소드나 서포트 벡터 머신(SVM) 등이 좋은 선택이라고 말하고 있습니다.

트위터의 휴고 라로쉘(Hugo Larochelle)도 인공지능은 궁극적인 목표이고 딥러닝을 그에 다다르기 위한 수단 중 하나라고 정의하고 있습니다. 소울 해커스 랩(Soul Hackers Labs)의 CEO 카를로스 아구에타(Carlos Argueta)는 자연어 처리나 컴퓨터 비전에 대해 이야기하면 사람들이 하나 같이 ‘딥러닝을 사용하나요?’ 라고 묻는데 아주 피곤하다고 하네요. 🙂

(업데이트) 7월말에 엔비디아(Nvidia) 블로그에 이와 관련된 글(What’s the Difference Between Artificial Intelligence, Machine Learning, and Deep Learning?)이 실렸습니다. 이 글에서도 딥러닝은 인공지능이나 머신러닝 보다 최근에 각광받기 시작했으며 머신러닝의 한 분야임을 잘 설명하고 있습니다.

deep_learning_icons_r5_png-jpg

 출처: 엔비디아 블로그