핸즈온 머신러닝 1장, 2장

b9267655530_l이 글은 한빛미디어에서 출간한 “핸즈온 머신러닝” 도서의 1장과 2장의 내용입니다. 1장, 2장은 머신러닝에 대한 개괄적인 소개와 머신러닝 프로젝트를 진행하는 자세한 단계를 포함하고 있어서 많은 사람들에게 유익한 자료가 되길 기대합니다. 이 책은 온라인(YES24교보문고)/오프라인 서점에서 구입하실 수 있습니다. 구입하시면 저에게 큰 도움이 됩니다. 🙂

★★★★★ 제가 본 한국어로 된 ML책중에서 최고의 기량을 갖추었습니다.(bk**ys 님)
♥♥♥♥ 좋은 책입니다. 꼭 읽어봅시다.(we**lifema 님)
★★★★ 현존하는 머신러닝 책중 최고.(wnghdcjfe 님)
★★★★★ 머신러닝/딥러닝계의 바이블이라고 생각합니다!(Kebee 님)
★★★★★ 책장에 꽂아두고 마르고 닳도록 꺼내 보는 그러한 책인 것이다.(dragmove 님)

도서의 내용을 공개할 수 있도록 허락해 주신 한빛미디어 출판사에 깊이 감사드립니다. 이 책의 저작권은 한빛미디어(주)에 있으므로 무단 복제 및 무단 전제를 금합니다.

추천의 글

옮긴이의 말

이 책에 대하여

감사의 글

1. 한눈에 보는 머신러닝

  1. 머신러닝이란?
  2. 왜 머신러닝을 사용하는가?
  3. 머신러닝 시스템의 종류
    1. 지도 학습과 비지도 학습
    2. 배치 학습과 온라인 학습
    3. 사례 기반 학습과 모델 기반 학습
  4. 머신러닝의 주요 도전 과제
    1. 충분하지 않은 양의 훈련 데이터
    2. 대표성 없는 훈련 데이터
    3. 낮은 품질의 데이터
    4. 관련 없는 특성
    5. 훈련 데이터 과대적합
    6. 훈련 데이터 과소적합
    7. 한걸음 물러서서
  5. 테스트와 검증
  6. 연습문제

2. 머신러닝 프로젝트 처음부터 끝까지

  1. 실제 데이터로 작업하기
  2. 큰 그림 보기
    1. 문제 정의
    2. 성능 측정 지표 선택
    3. 가정 검사
  3. 데이터 가져오기
    1. 작업환경 만들기
    2. 데이터 다운로드
    3. 데이터 구조 훑어보기
    4. 테스트 세트 만들기
  4. 데이터 이해를 위한 탐색과 시각화
    1. 지리적 데이터 시각화
    2. 상관관계 조사
    3. 특성 조합으로 실험
  5. 머신러닝 알고리즘을 위한 데이터 준비
    1. 데이터 정제
    2. 텍스트와 범주형 특성 다루기
    3. 나만의 변환기
    4. 특성 스케일링
    5. 변환 파이프라인
  6. 모델 선택과 훈련
    1. 훈련 세트에서 훈련하고 평가하기
    2. 교차 검증을 사용한 평가
  7. 모델 세부 튜닝
    1. 그리드 탐색
    2. 랜덤 탐색
    3. 앙상블 방법
    4. 최상의 모델과 오차 분석
    5. 테스트 세트로 시스템 평가하기
  8. 론칭, 모니터링, 그리고 시스템 유지 보수
  9. 직접 해보세요!
  10. 연습문제

넘파이 튜토리얼

핸즈온 머신러닝 1장, 2장”에 대한 9개의 생각

  1. gyogyo

    from sklearn.datasets import fetch_mldata
    mnist = fetch_mldata(‘MNIST original’)

    이 두 줄을 실행하면 아래의 에러가 뜹니다. 왜 그럴까요?
    IndexError: index out of range

    좋아요

    응답
    1. 박해선 글의 글쓴이

      사이킷런은 mldata.org 사이트에서 예제 데이터를 다운로드하는데요. 이 사이트 지금 접속이 안되네요. ㅠ.ㅠ 아마도 데이터를 제대로 다운받지 못해서 발생하는 문제인 것 같습니다. 제 컴퓨터의 ~/scikit_learn_data/mldata/mnist-original.mat 파일 사이즈가 53메가 정도되는데 비교해서 확인해 보시면 좋을 것 같네요.

      좋아요

      응답
      1. 전창민

        mldata.org에 계속 접근이 안되는데 혹시 다른 방법이 있을까요…?
        코드 실행하면 TimeoutError가 뜨고 mldata.org자체도 로딩이 안되네요

        좋아요

      2. gyogyo

        Copy 해도 index out of range 에러가 계속 뜹니다. 파일이 없다는 것이 아니고, 뭔가 다른 에러가 아닐까요?

        좋아요

      3. 박해선 글의 글쓴이

        mnist-original.mat 파일을 확실히 덮어 썼는지 확인해 보시겠어요? 이 파일의 사이즈는 55,440,440 바이트입니다. 사이즈가 맞다면 인터넷 연결이 없어도 fetch_mldata(‘MNIST original’) 함수 호출에서 에러가 발생하지 않을 것 같습니다.

        좋아요

  2. gyogyo

    p228 Gini impurity 계산하는 본문에 오류가 있습니다. 식 6-1의 윗줄에 ” 예를 들어, 깊이 2의 왼쪽 노드의 gini 점수는 1- (0/54)^2 – (49/54)^2 ∽ 0.168입니다. ” 라는 문구가 있는데요. 계산수식에 -(5/54)^2 항을 추가해야 할 듯 합니다.

    번역이 너무너무 깔끔해서 공부하기 좋네요. 정말 감사드립니다.

    좋아요

    응답

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 /  변경 )

%s에 연결하는 중

This site uses Akismet to reduce spam. Learn how your comment data is processed.