태그 보관물: Hands-on Machine Learning 2/E

핸즈온 머신러닝 2/E 번역 후기

핸즈온 머신러닝 2판(Hands-on Machine Learning with Scikit-Learn, Keras & TensorFlow)의 번역을 마치고 후기를 남깁니다. 2판 원서는 작년 9월에 나왔습니다. 1판에 이어 역시 아마존 베스트 셀러가 되었네요. 번역 완료는 예상보다 조금 늦었습니다. 많은 분들이 기다리실텐데 죄송합니다. ㅠ.ㅠ 아마 4월 중순에 서점에서 만날 수 있을 것 같습니다.

도움을 주신 한빛미디어 윤나리 님, 교정을 봐주신 백지선 님께 감사드립니다.

2판은 1판에 비해 딥러닝 부분이 대폭 바뀌었고 분량도 크게 늘어났습니다. 텐서플로 2가 릴리스되었고 케라스가 핵심 API로 채택되면서 어느정도 예상되었습니다. 원서는 800페이지가 조금 넘습니다. 번역서는 900페이지를 훌쩍 넘길 것 같습니다. 또 원서와 마찬가지로 풀 컬러로 인쇄됩니다. 그럼 어떤 부분이 바뀌었는지 간단히 정리해 보겠습니다.

신경망을 소개하는 챕터를 유지하면서 케라스 소개를 추가했습니다. 특히 케라스를 사용한 사용자 정의 모델, 층, 측정 지표, 손실 함수 등을 자세히 소개한 점이 좋습니다. 새롭게 소개된 tf.data와 TFRecord, TF Datasets을 챕터 하나를 할애하여 자세히 설명하고 있습니다.

합성곱 신경망의 서두는 1판의 내용을 유지하면서 새로운 모델과 객체 탐지(object detection)와 시맨틱 분할(semantic segmentation)을 추가했습니다. 순환 신경망은 많이 바뀌었습니다. 기계 번역을 조금 더 자세히 설명하고 어텐션 메카니즘과 트랜스포머를 소개합니다. 2판에서는 RNN과 CNN을 사용한 시퀀스 처리에 별도의 장을 할애했습니다. 이름과는 달리 1D 합성곱이 끝에 살짝 나와서 사실 RNN 장이 거의 두 배로 늘어난 셈입니다.

1판의 오토인코더 장에 GAN이 추가되었습니다. DCGAN, ProGAN, StyleGAN을 포함합니다. GAN만 보아서는 조금 아쉽습니다. 미술관에 GAN 딥러닝을 함께 보면 도움이 될 것 같습니다. 강화학습 챕터도 TF-Agents를 추가하면서 거의 두 배로 분량이 늘어났습니다. 늘어난 분량 덕택에 쪽수로 보면 2/3 정도가 딥러닝을 다루게 되었습니다.

1부는 비지도 학습 장이 추가된 것 외에는 큰 변화가 없습니다. 대부분 사이킷런 최신 버전을 반영하고 모호한 표현을 다듬거나 설명을 보완했습니다. 비지도 학습은 1판에서 아쉬웠던 부분 중 하나입니다. 2판에서는 사이킷런을 사용해 K-평균, DBSCAN, 가우시안 혼합 모델을 자세히 소개합니다. 알고리즘 소개에 그치지 않고 여러 활용 사례를 함께 다루고 있어서 좋았습니다.

마지막으로 텐서플로 분산 훈련과 배포에 관한 장도 많이 바뀌었습니다. 충분하지는 않지만 구글 클라우드의 AI 플랫폼을 다루고 있어서 좋았습니다. 때마침 한국에도 구글 클라우드 리전이 생겼으니까요. 구글 클라우드 AI 플랫폼에 대해 조금 더 깊게 다루는 다른 책을 기대하고 있습니다.


번역하는 동안 참 많은 일들이 있었습니다. 작년 말에 오랫동안 미뤄왔던 집수리를 시작했습니다. 짐을 창고에 맡기고 가족이 원룸으로 피신해서 두 달을 살았습니다. 아마 다시는 안할 것 같습니다. ㅠ.ㅠ 몸은 힘들고 고생이 많았지만 지금은 깨끗한 집에서 잘 지내고 있습니다.

이보다 조금 더 일찍 작은 프로젝트에 참여하게 되었습니다. 정해진 기간내에 일을 마쳐야 한다는 강박이 모든 사람을 힘들게 하는 것 같습니다. 원치 않는 상처를 받고 원치 않는 상처를 주고 맙니다. 돌이켜 보면 후회가 많이 됩니다. 힘들 때마다 글쓰는 것이 위로가 되었습니다. 책은 화를 내거나 불평하지 않고 온전히 저만의 세상을 만들어 주기 때문이죠.

지금은 코로나 바이러스로 전 세계가 몸살을 앓고 있습니다. 다행히 제 주변에는 아픈 사람이 없네요. 연일 들려오는 뉴스를 보면 꿈인지 현실인지 믿기지 않습니다. 책 저자인 오렐리앙은 에러타를 등록하면 회신을 잘 해줍니다. 왜 오류가 생겼는지 설명하거나 오류 같지만 아닌 이유를 설명해 주기도 합니다. 그런데 지난해 말부터 에러타에 회신이 없었습니다. 이사를 했기 때문에 바빠서 그런가 보다 생각했죠. 몇 달 만에 메일이 왔는데 그동안 매우 아팠다고 합니다. 친절하게도 코로나 바이스러스 때문에 한국 걱정도 해주었습니다(한 달 전이라 한국이 위험하다고 생각한 것 같습니다. 지금은 정 반대가 되었죠). 오렐리앙도 어서 건강을 찾아 자리를 털고 일어났으면 좋겠습니다.

코로나 바이스러스 때문에 3월 텐서플로 데브 서밋이 취소되어 (구글에서 예약해 준) 호텔과 항공권을 모두 취소했습니다. 또 5월에 초청받은 구글 IO도 취소되었죠. 한국 커뮤니티를 알릴 수 있는 좋은 기회였는데 아쉬웠습니다(심지어 텐서플로 데브 서밋에 제 얼굴과 이름이 나왔는데 말이죠). 아마 올 상반기에는 국내외를 막론하고 개발자를 위한 이벤트가 열리기 어려울 것 같습니다.


이제 곧 텐서플로 2.2.0 버전이 릴리스될 예정입니다. 새 버전에 맞춰 깃허브 노트북을 모두 다시 검토하고 노트북에 있는 텍스트도 번역해야 합니다. 또 그간 미뤄왔던 텐서플로 문서 번역에도 더 공을 들여야겠습니다.

올해는 책 복이 많을 것 같습니다. 머신러닝 분야의 또 다른 좋은 두 책이 기다리고 있기 때문입니다. 하나는 세바스찬 라시카의 Python Machine Learning 3/E입니다(2판은 머신 러닝 교과서로 번역되었습니다). 이미 아마존에서 높은 인기를 얻고 있습니다. 역시 텐서플로 2를 기반으로 많은 변화를 주었고 GAN과 강화학습이 추가되었습니다. 또 하나는 케라스 창시자인 프랑소와 숄레의 Deep Learning with Python 2/E입니다(1판은 케라스 창시자에게 배우는 딥러닝으로 번역되었습니다). 프랑소와의 책도 Keras 패키지에서 tf.keras로 바꾸고 CNN, RNN의 고급 기법을 많이 다룰 것으로 예상됩니다. 프랑소와의 책은 기술 뿐만 아니라 딥러닝에 대한 저자의 견해를 읽을 수 있기 때문에 기대가 많이 됩니다.


쓰다 보니 길어졌네요. 요즘엔 건강이 최곱니다. 코로나 바이러스 주의하시구요. 핸즈온 머신러닝 2/E은 곧 찾아 뵙겠습니다. 기대해 주세요! 🙂