<혼자 공부하는 데이터 분석 with 파이썬>은 파이썬을 사용하여 데이터 분석에 입문하는 분들이 배워야 할 다양한 개념과 도구를 소개합니다. 재미있는 스토리텔링과 귀여운 삽화를 추가하여 지루하지 않고 끝까지 책을 읽을 수 있도록 돕습니다.
이 책은 데이터 수집, 정제, 시각화, 기술 통계, 가설 검정, 머신러닝을 다룹니다. 모든 코드는 구글 코랩을 사용해 연습할 수 있습니다. 노트북에 파이썬이나 다른 도구를 설치할 필요가 없고 웹 브라우저만 사용해 모든 예제를 실습할 수 있습니다. 목차는 다음과 같습니다.
- 데이터 분석을 시작하며
- 데이터 수집하기
- 데이터 정제하기
- 데이터 요약하기
- 데이터 시각화하기
- 복잡한 데이터 표현하기
- 검증하고 예측하기
혼공족을 위한 동영상 강의도 제공됩니다. 또 한빛미디어 혼공단에도 참여하시면 완독하시는데 큰 도움이 되실거에요! 🙂
- 온라인/오프라인 서점에서 판매중입니다. [교보문고] [Yes24] [알라딘] [한빛미디어]
- 496페이지,
26,000원 –> 23,400원, 전자책: 20,800원 - 이 책에 실린 코드는 깃허브에 있습니다.
이 페이지에서 책의 에러타와 라이브러리 버전 변경에 따른 바뀐 점들을 계속 업데이트 하겠습니다. 이 책에 대해 궁금한 점이나 오류가 있으면 이 페이지 맨 아래 ‘Your Inputs’에 자유롭게 글을 써 주세요. 또 제 이메일을 통해서 알려 주셔도 되고 구글 그룹스 머신러닝/딥러닝 도서 Q&A에 글을 올려 주셔도 좋습니다. 또 카카오톡 오픈 채팅(참여코드: flow)에 오셔서 문의해 주셔도 좋습니다.
감사합니다! 🙂
Outputs (aka. errata)
- (p254) 맨 위의 <핵심 키워드>와 맨 아래에서 두 번째 줄에서 “상자 수염 그래프를“를 “상자 수염 그림을“으로 수정합니다.
- (p279) 6번 문제에서 “상자 수염 그래프“를 “상자 수염 그림“으로 수정합니다.
- (p404) <여기서 잠깐> 상자의 두 번째 줄 “하지만 코랩은 ~ 사이파이 1.8 버전 이상을 사용한다면”을 “코랩을 사용한다면
!pip install -U scipy
명령으로 사이파이를 최신 버전으로 업데이트한 다음”으로 수정합니다. - (p151) 5번 문제
df2
데이터프레임의 열 이름col1
,col2
를col3
,col4
로 변경합니다.(박*필 님) - (p183) 4번 문제 첫 문장과 그림 위에 쓰인 ‘df2‘를 ‘df‘로 정정합니다. 4번 문제 첫 문장에 ‘중복된 열을’을 ‘중복된 행을’로 정정합니다. 데이터프레임 그림에서 네 번째 행, 두 번째 열의 값을 3에서 1로 정정합니다.(고*진 님)
- (p211) 마지막에서 3번째 줄에 “클래스 이름이 ‘info_auth‘인”을 “클래스 이름이 ‘info_pub‘인”로 정정합니다.(고*진 님)
- (p163) 아래에서 2번째 줄에 “모든 값이 비어있는 열을”을 “NaN이 들어있는 열을”로 정정합니다.
- (p171) 아래에서 3번째 줄에서 “‘파친코 1권’, ‘파친코 2권’처럼 권 수가 한 개 이상인”을 “권 수가 한 개 이상인”으로 수정합니다. 아래에서 2번째 줄에 “예를 들어 ‘도서명’, ‘출판사'”를 “‘도서명’, ‘출판사'”로 수정합니다.
- (p204) 첫 번째 손코딩의 1번째 줄에서
'.*(\d{4}).*'
를r'.*(\d{4}).*'
로 수정합니다. - (p138) 위에서 5번째 줄
prd_info = soup.find('a', attrs={'class':'gd_name'})
다음에 다음 코드를 추가합니다.if prd_info == None: return ''
- (p451) (관련 이슈) 여기서 잠깐의 제목 끝에 주석 추가 “<주석>SQLAlchemy 패키지는 판다스와 호환되지 않는 문제가 있습니다. 판다스에서 이를 수정하기 전까지는 다음 명령으로 SQLAlchemy 1.4.46 버전을 설치해서 사용해 주세요.
pip install -U sqlalchemy==1.4.46
</주석>” - (p332) 첫 번째 손코딩과 (p349) 첫 번째 손코딩을 다음과 같이 바꿔 주세요. 또한 폰트를 설치한 후에 런타임을 다시 시작할 필요가 없습니다.(들여쓰기는 깃허브 노트북을 참고하세요. https://github.com/rickiepark/hg-da/blob/main/06-1.ipynb)
# 노트북이 코랩에서 실행 중인지 체크합니다.
import sys
if 'google.colab' in sys.modules:
!echo 'debconf debconf/frontend select Noninteractive' | debconf-set-selections
# 나눔 폰트를 설치합니다.
!sudo apt-get -qq -y install fonts-nanum
import matplotlib.font_manager as fm
font_files = fm.findSystemFonts(fontpaths=['/usr/share/fonts/truetype/nanum'])
for fpath in font_files:
fm.fontManager.addfont(fpath) - (p478) 01-2절의 3번 문제 답에서 2번과 4번의 답이 서로 바뀌었습니다.(채*지 님)
Your Inputs