–
최근 의료 진단부터 소셜 네트워크 친구 추천까지 머신러닝이 많은 상용 애플리케이션과 연구 프로젝트에서 꼭 필요한 요소가 되었습니다. 사람들 대부분이 머신러닝을 연구 인력이 많은 큰 회사에서나 적용하는 것으로 생각합니다. 이 책을 통해서 머신러닝 솔루션을 얼마나 쉽게 만들 수 있는지, 최선의 방법은 무엇인지 알리고 싶습니다. 이 책을 읽고 나면 트위터에서 사람들이 느끼는 감정을 분석하고 지구 온난화를 예측하는 자신만의 시스템을 만들 수 있습니다. 머신러닝을 적용할 수 있는 곳은 헤아릴 수 없이 많으며 요즘엔 학습에 활용할 수 있는 수많은 데이터가 공개되어 있기까지 합니다. 부족한 건 우리의 상상력뿐입니다.
–
누구를 위한 책인가
이 책은 머신러닝으로 실제 문제에 대한 해법을 찾는 머신러닝 기술자와 예비 기술자를 위해 썼습니다. 머신러닝과 인공지능에 대한 사전 지식이 필요 없는 입문서입니다. 파이썬과 scikit-learn에 중점을 두었으며 머신러닝 애플리케이션을 성공적으로 만들기 위한 모든 단계를 밟아갑니다. 여기서 소개하는 방법들은 상용 애플리케이션을 만드는 데이터 전문가는 물론 연구자와 과학자에게도 도움이 될 것입니다. 파이썬과 NumPy, matplotlib 라이브러리에 친숙하다면 이 책의 대부분을 이해할 수 있습니다.
이 책은 수학보다 머신러닝 알고리즘을 실용적으로 사용하는 데 초점을 맞추었습니다. 머신러닝의 바탕이 수학(특히 확률 이론)으로 이루어져 있으므로 알고리즘을 너무 자세하게 분석하지는 않았습니다. 머신러닝 알고리즘의 수학 이론에 관심이 있다면 트레버 헤이스티Trevor Hastie, 로버트 팁시라니Robert Tibshirani, 제롬 프리드먼Jerome Friedman의 『The Elements of Statistical Learning』(Springer, 2009 )을 추천합니다. 이 책은 저자의 웹사이트(http://statweb.stanford.edu/~tibs/ElemStatLearn/)에서 무료로 읽을 수 있습니다. 여기서는 머신러닝 알고리즘을 밑바닥부터 만드는 법을 다루지는 않으며 대신 scikit-learn과 다른 라이브러리에 이미 구현된 방대한 양의 모델을 사용하는 법에 집중하겠습니다
–
이 책을 쓴 이유
머신러닝과 인공지능 관련 책은 많습니다. 하지만 대부분 컴퓨터 과학을 전공하는 대학원생을 위한 것이고 어려운 수학으로 가득 차 있습니다. 이는 머신러닝이 연구와 상용 애플리케이션에서 일상적으로 사용되는 방식과 극명하게 대립됩니다. 요즘엔 머신러닝을 사용하기 위해 학위를 받을 필요가 없습니다. 그런데도 복잡한 수학을 동원하지 않고 실용적으로 머신러닝을 구축하는 모든 면을 다루는 책이 매우 드뭅니다. 미적분, 선형대수, 확률을 공부하지 않았어도 이 책으로 머신러닝을 사용할 수 있게 되기를 바랍니다.
–
–