태그 보관물: Introduction to ML with Python

scikit-learn 개발자에게 물어봅시다!

지금 번역하고 있는 책(Introduction to Machine Learning with Python)의 저자 안드리아스 뮐러(Andreas Müller)는 사이킷런(scikit-learn)의 핵심 개발자로 사이킷런 개발과 운영에 모두 깊게 참여하고 있습니다. 또 앤디는 뉴욕대학교의 리서치 엔지니어였는데 올해부터는 콜롬비아 대학에서 머신 러닝 강의를 맡고도 있습니다.

책을 번역하면서 저자에게 직접 이메일 인터뷰를 할 기회를 얻었습니다. 머신 러닝과 사이킷런에 관한 것이라면 무엇이든지 보내 주세요! 재미있고 또 다른 독자에게도 유익한 질문이면 더 좋겠지요. 보내주신 질문을 정리해서 저자에게 보내겠습니다. 이 질문과 저자의 대답은 번역서에도 부록으로 실을 예정입니다. haesunrpark+sklearn at gmail.com 으로 보내 주셔도 되고 아래 입력 폼을 사용하셔도 됩니다!

  • Kwak ** 님: IncrementalPCA 처럼 LDA(Linear Discriminant Analysis)에 온라인 러닝을 할 수 있는 기능을 추가할 계획은 없나요?
  • Choi ** 님: 실전에서 Bagging 만으로 충분하기 때문에 Jackknife(Leave-one-out) 방식의 회귀 모델이 없는 것인가요?
  • piper 님: 딥러닝이 큰 붐을 일으키고 있습니다. 딥러닝(뉴럴 네트워크)외에 다른 지도학습 알고리즘을 사용했을 때의 장점은 무엇일까요? 딥러닝 엔지니어도 머신 러닝을 꼭 알아야 하는 지 궁금합니다.
  • lunrot 님: Hidden Markov Model 이 사이킷런 0.17 에서 제외된 이유는 무엇인가요? 혹시 다시 추가될 가능성은 없는지요?

[Review]Introduction to ML with Python

catIntroduction to ML with Python은 사이킷런(scikit-learn) 0.18 버전이 출시된 후 가장 먼저 나온(작년 10월 출간) 파이썬 머신러닝 책입니다. 이전 포스트에서도 잠깐 언급한 적이 있지만 사이킷런 0.18 버전에는 피드포워드(feed-forward) 뉴럴 네트워크 클래스가 추가되었습니다. 그래서 이 책에도 이와 관련된 섹션이 추가되어 있네요. 이 책의 저자 중 한명인 앤디(Andreas C. Muller)는 뉴욕 대학교의 리서치 엔지니어이면서 사이킷런의 핵심 개발자입니다. 머신러닝 PhD로서 머신러닝에 대해서 잘 알고 있을  뿐만 아니라 사이킷런에 대해서 누구보다도 잘 알고 있음은 두말할 필요가 없습니다.

머신러닝의 실용서와 이론서의 측면을 모두 담은 책은 쉽게 보기 힘듭니다. 특히나 여러 종류의 알고리즘에 걸쳐서라면 더욱 그렇습니다. 이 책은 후자 보다는 전자에 무게를 실었습니다. 수식은 과감히 덮고 가능하면 직관적으로 이해할 수 있도록 배려했으며 무엇보다도 상당히 많은 종류의 알고리즘을 설명하고 사이킷런으로 예시를 보여주고 있습니다. 이 책을 번역서로 내기 위해 제가 번역 작업을 진행하고 있고 대략 70% 정도 진척이 되었습니다. 전체 내용을 가늠하실 수 있도록 챕터별 내용을 요약했습니다.

계속 읽기