월간 보관물: 2020 10월

“핸즈온 머신러닝 2″의 넘파이, 맷플롯립, 판다스 튜토리얼

<핸즈온 머신러닝 2>의 깃허브에서 제공하는 넘파이(tools_numpy.ipynb), 맷플롯립(tools_matplotlib.ipynb), 판다스 튜토리얼(tools_pandas.ipynb) 번역을 모두 마쳤습니다! 🙂

이 노트북은 깃허브에서 볼 수 있고 주피터 노트북 뷰어에서 볼 수 있습니다. 특히 ml-ko 사이트에서는 html로 빠르게 코드와 결과를 볼 수 있습니다. 노트북에 코랩 링크도 포함되어 있으니 시간날 때 언제든지 따라해 보세요!

사이킷런의 load_boston() 함수가 삭제될 예정입니다.

사이킷런의 load_boston() 함수가 삭제될 예정입니다. 이 데이터셋의 문제는 특성 “B” 때문입니다. 문서에서 볼 수 있듯이 이 특성은 도시의 흑인 비율을 사용합니다. 흑인 비율이 주택 가격에 미치는 요소인 거죠. 시대가 시대인만큼 요즘엔 수용하기 쉽지 않습니다. 오히려 이제야 문제가 제기되었다는 것이 부끄러울 수 있죠.

이 데이터를 삭제할지, 특성만 제거할지 의견이 다양했는데요. 결국 deprecate 경고를 내고 0.26 버전 즈음에서 삭제될 것 같습니다. 문제는 이 데이터셋이 책이나 블로그 등에 예제로 너무 많이 쓰였다는 점입니다. 제가 번역한 책에도 몇 군데 있을 것 같네요. ㅠ.ㅠ

사이킷런에서는 사라지겠지만 fetch_openml 함수를 사용하여 OpenML에서 가져올 수 있습니다.

from sklearn import datasets
X, y = datasets.fetch_openml('boston', return_X_y=True)

더 자세한 내용은 사이킷런 깃허브의 이슈를 참고하세요.

TF Python 3.5 support drop, TF Java release

Python 3.5 버전의 지원이 2020년 9월에 종료됨에 따라 파이썬 3.5용 텐서플로도 10월부터 지원이 중지됩니다. 2020년 10월 13일부터 나이틀리(nightly) 패키지가 만들어지지 않고 향후 TF 릴리스에도 파이썬 3.5 버전은 더 이상 포함되지 않습니다. 현재 텐서플로는 파이썬 3.5, 3.6, 3.7, 3.8을 지원하고 있습니다.

텐서플로 Java 0.2.0 버전이 릴리스되었습니다. 이는 첫 번째 알파 버전으로 텐서플로 2.3.1 버전을 기반으로 구성되었습니다. 자바 사용자들에게는 기쁜 소식입니다. 하지만 자바 버전이 왜 필요한지 의문을 다는 사람도 있네요. 🙂