혼자 공부하는 데이터 분석 with 파이썬

<혼자 공부하는 데이터 분석 with 파이썬>은 파이썬을 사용하여 데이터 분석에 입문하는 분들이 배워야 할 다양한 개념과 도구를 소개합니다. 재미있는 스토리텔링과 귀여운 삽화를 추가하여 지루하지 않고 끝까지 책을 읽을 수 있도록 돕습니다.

이 책은 데이터 수집, 정제, 시각화, 기술 통계, 가설 검정, 머신러닝을 다룹니다. 모든 코드는 구글 코랩을 사용해 연습할 수 있습니다. 노트북에 파이썬이나 다른 도구를 설치할 필요가 없고 웹 브라우저만 사용해 모든 예제를 실습할 수 있습니다. 목차는 다음과 같습니다.

  1. 데이터 분석을 시작하며
  2. 데이터 수집하기
  3. 데이터 정제하기
  4. 데이터 요약하기
  5. 데이터 시각화하기
  6. 복잡한 데이터 표현하기
  7. 검증하고 예측하기

혼공족을 위한 동영상 강의도 제공됩니다. 또 한빛미디어 혼공단에도 참여하시면 완독하시는데 큰 도움이 되실거에요! 🙂

이 페이지에서 책의 에러타와 라이브러리 버전 변경에 따른 바뀐 점들을 계속 업데이트 하겠습니다. 이 책에 대해 궁금한 점이나 오류가 있으면 이 페이지 맨 아래 ‘Your Inputs’에 자유롭게 글을 써 주세요. 또 제 이메일을 통해서 알려 주셔도 되고 구글 그룹스 머신러닝/딥러닝 도서 Q&A에 글을 올려 주셔도 좋습니다. 또 카카오톡 오픈 채팅(참여코드: flow)에 오셔서 문의해 주셔도 좋습니다.

감사합니다! 🙂


Outputs (aka. errata)

  1. (p254) 맨 위의 <핵심 키워드>와 맨 아래에서 두 번째 줄에서 “상자 수염 그래프를“를 “상자 수염 그림을“으로 수정합니다.
  2. (p279) 6번 문제에서 “상자 수염 그래프“를 “상자 수염 그림“으로 수정합니다.
  3. (p404) <여기서 잠깐> 상자의 두 번째 줄 “하지만 코랩은 ~ 사이파이 1.8 버전 이상을 사용한다면”을 “코랩을 사용한다면 !pip install -U scipy 명령으로 사이파이를 최신 버전으로 업데이트한 다음”으로 수정합니다.
  4. (p151) 5번 문제 df2 데이터프레임의 열 이름 col1, col2col3, col4로 변경합니다.(박*필 님)
  5. (p183) 4번 문제 첫 문장과 그림 위에 쓰인 ‘df2‘를 ‘df‘로 정정합니다. 4번 문제 첫 문장에 ‘중복된 을’을 ‘중복된 을’로 정정합니다. 데이터프레임 그림에서 네 번째 행, 두 번째 열의 값을 3에서 1로 정정합니다.(고*진 님)
  6. (p211) 마지막에서 3번째 줄에 “클래스 이름이 ‘info_auth‘인”을 “클래스 이름이 ‘info_pub‘인”로 정정합니다.(고*진 님)
  7. (p163) 아래에서 2번째 줄에 “모든 값이 비어있는 열을”을 “NaN이 들어있는 열을”로 정정합니다.
  8. (p171) 아래에서 3번째 줄에서 “‘파친코 1권’, ‘파친코 2권’처럼 권 수가 한 개 이상인”을 “권 수가 한 개 이상인”으로 수정합니다. 아래에서 2번째 줄에 “예를 들어 ‘도서명’, ‘출판사'”를 “‘도서명’, ‘출판사'”로 수정합니다.
  9. (p204) 첫 번째 손코딩의 1번째 줄에서 '.*(\d{4}).*'r'.*(\d{4}).*'로 수정합니다.
  10. (p138) 위에서 5번째 줄 prd_info = soup.find('a', attrs={'class':'gd_name'}) 다음에 다음 코드를 추가합니다.
    if prd_info == None: return ''
  11. (p451) (관련 이슈) 여기서 잠깐의 제목 끝에 주석 추가 “<주석>SQLAlchemy 패키지는 판다스와 호환되지 않는 문제가 있습니다. 판다스에서 이를 수정하기 전까지는 다음 명령으로 SQLAlchemy 1.4.46 버전을 설치해서 사용해 주세요. pip install -U sqlalchemy==1.4.46</주석>”
  12. (p332) 첫 번째 손코딩과 (p349) 첫 번째 손코딩을 다음과 같이 바꿔 주세요. 또한 폰트를 설치한 후에 런타임을 다시 시작할 필요가 없습니다.(들여쓰기는 깃허브 노트북을 참고하세요. https://github.com/rickiepark/hg-da/blob/main/06-1.ipynb)
    # 노트북이 코랩에서 실행 중인지 체크합니다.
    import sys
    if 'google.colab' in sys.modules:
    !echo 'debconf debconf/frontend select Noninteractive' | debconf-set-selections
    # 나눔 폰트를 설치합니다.
    !sudo apt-get -qq -y install fonts-nanum
    import matplotlib.font_manager as fm
    font_files = fm.findSystemFonts(fontpaths=['/usr/share/fonts/truetype/nanum'])
    for fpath in font_files:
    fm.fontManager.addfont(fpath)
  13. (p478) 01-2절의 3번 문제 답에서 2번과 4번의 답이 서로 바뀌었습니다.(채*지 님)

Your Inputs