개발자들에게 가장 유명한 사이트 中 하나인 GitHub.com에서는

매년 Octoverse라는 이름으로 1년간의 성과와 통계를 공개한다.

- https://octoverse.github.com/

 

Octoverse

 

그러면 Python은 2021년에 몇 번째로 사랑받았을까?!

 

Top Language

 

JavaScript에 이어 2번째로 인기있는 언어가 바로 Python이다.

 

 

그러면 Python을 공부하기에 좋은 책은 어떤 것이 있을까?!

 

혼자 공부하는 파이썬

 

책 표지에도 딱! 나와있듯이 "파이썬 분야 1위" 책이다 !!!

 

10쇄

 

그렇다! 무려 10쇄 !!!

 

많이 팔리는 책에는 분명히 이유가 있을 것이다.

 

학습가이드

 

혼공학습단

 

책 제목에 분명히 써 있듯이 "혼자 공부"하기에 정말 최적의 Python 서적인 것이다.

 

실제 해당 사이트에 가보면 정말 많은 것을 제공해주고 있다.

- https://hongong.hanbit.co.kr/%ed%8c%8c%ec%9d%b4%ec%8d%ac/

 

공식사이트

 

정말 고맙게도 동영상 강의도 무료로 제공해주고 있다.

 

동영상

 

혼자서 공부하자니 동기부여가 잘 안된다면

한빛미디어에서 정기적으로 모집하는 "혼공학습단"과 같은 이벤트에 참여하면 경품까지고 노릴 수 있다.

 

 

책 내용도 보면 정말 친절하기 그지없다.

줄 간격도 여유있게 되어 있어서 보기에 부담스럽지 않다.

 

샘플

 

얼마나 친절하냐면,

코딩 전용 폰트 설치하는 것까지 책은 물론이고 동영상으로도 설명을 해준다.

 

코딩 전용 폰트

 

조금 아쉬운 점은 예제소스를 다운로드 받아서 사용해야 한다는 점인데...

사실 github.com에서 검색하면 누군가 올려놓은 소스코드들을 쉽게 찾아볼 수는 있다.

 

예제소스

 

총평하자면,

혼자서 Python을 공부하기에는 가장 최적의 선택

무료 동영상 및 많은 커뮤니티를 통한 다양한 자료 활용 가능

다만, 정말 처음으로 Python을 공부하는 사람에게 적합

중급 이상에게는 너무 쉬운 책

반응형

 

파이썬 라이브러리를 활용한 데이터 분석 2판

 

표지

 

이번에 보게된 책은

"데이터 분석을 위해 파이썬 라이브러리를 사용하는 방법"을

알려주는 교과서와 같은 유명한 책이다.

 

 

교과서와 같은 책이라고 해서

오래된 책이라고 생각할 수도 있는데

오래된 책 맞다.

 

그렇다고 해서 'out of date' 된 책은 아니다.

 

제목에도 써있는 것처럼

"2판"으로 나왔기 때문이다.

 

2판 5쇄

 

거기에다가 5쇄까지 찍었다.

유명한 책인 것은 분명하다.

 

2판

 

결론적으로 2019년에 2판으로 업데이트 했고

내용은 지금도 유효하다!!!

 

 

 

"학습 환경"

이 책에서 제안하는 학습 환경은

Anaconda 설치해서

IPython 또는 Jupyter Notebook

사용하는 것이다.

 

IPython & Jupyter

 

Jupyter Notebook의 근간이 IPython 이라는 것을

처음 알았다 @.@

 

 

추가적으로 IDE(통합 개발 환경)를 소개해주기는 하는데,

결국은 IPython 또는 Jupyter Notebook을

사용하는 것을 권장하고 있다.

IDE

VSCode(Visual Studio Code) 언급이 없는 것으로 보아

2019년 이전에 작성한 책이 맞는 것 같다 ^^

하지만, 공부에는 지장이 없다 !!!

 

 

 

책 내용은

기본 자료형부터 설명을 시작하면서

Numpy와 Pandas를 중심으로

너무나 잘 설명해주고 있다.

 

책 내용도 훌륭하지만,

코드 예제 데이터는 꼭 찾아보길 바란다.

https://github.com/wesm/pydata-book

 

단순히 샘플 코드만 있는 것이 아니라

Jupyter Notebook 파일로 제공해주면서

설명하는 내용까지 담겨있다.

 

예제 코드

 

최근 많은 분들이 계속 관심을 많이 갖고 있는

Machine Learning, Deep Learning, Big Data 등의

공부를 하게 되면

반드시 거쳐가는 것이 바로

Python 특히, Numpy & Pandas 라이브러리에 대해서

공부를 하게 된다.

 

이 때, 정말 많은 도움이 될 책으로 추천할 수 있을 것 같다!!!

 

 

 

이 책을 보면서 특히 호감이 들었던 부분이

바로 "Chapter 11. 시계열" 이다.

 

시계열 데이터

 

개인적으로 Python으로 작업하면서

많은 고생을 했던 (즉, 시간을 엄청 많이 빼았겼던)

부분이 바로 "날짜" & "시간" 이었다.

 

즉, "시계열" 데이터 인데,

이것을 하나의 챕터로 깊게 다뤄주고 있어서

정말 감동했다.

 

 

 

이 책에 대해서 짧게 서평하자면

Python으로 데이터를 다루고 싶은 모든 분들에게 추천하는 책이다.

 

Numpy, Pandas는 물론이고

기본 내장 데이터형부터 시작해서

고급 데이터 분석까지 차분히 설명해주고 있다.

 

 

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

반응형

 

머신러닝/딥러닝 개발과 관련하여

대중적으로 가장 유명한 것은 `텐서플로(Tensorflow)`일 것이다.

 

GitHub에서도 지금(21년 8월) 현재 159k stars를 자랑하고 있으니....^^

https://github.com/tensorflow/tensorflow

 

 

`파이토치(Pytorch)`는 그정도의 인기는 없다.

아직 50.4k stars 밖에 안된다.

https://github.com/pytorch/pytorch

 

 

하지만, 최근 협업에서는

Tensorflow 보다 Pytorch가

더 많은 인기(?)를 얻고 있다.

 

 

이런 Pytorch를 처음 공부할 때

적합해보이는 책이 있다.

 

파이토치 첫걸음 - 딥러닝 기초부터 RNN, 오토인코더, GAN 실전 기법까지

파이토치 첫걸음

 

파이토치 첫걸음 - 10점
최건호 지음/한빛미디어

 

 

책을 본 첫 느낌은

산뜻한 색상의 표지 + 232쪽 얇은 두께 + 아담한 A5 크기

결론적으로

작고 얇은 예쁜 책!!!

 

 

목차

 

 

그리고 목차를 보면

친절하게도 딥러닝이 무엇인지

파이토치를 어떻게 설치해야하는지도 알려주고 있다.

 

 

딥러닝

 

체스를 보여주며 인공지능을 상징하고

스팸 메일 분류를 가지고 머신러닝을

고양이 판별하는 것으로 딥러닝을 설명해주고 있는 그림을 보면서

감동도 했다!

 

`정말 꼼꼼하게 신경써서 만든 책이구나~`

 

 

 

신경망

 

처음에는 단색 인쇄인 줄 알았지만,

필요에 따라 color가 사용되기도 하고

중간에 폴컬러 인쇄가 되어있기도 하다.

 

 

 

지금까지 좋은 말을 했으니

이제는 아쉬운 점을 이야기하자면...

 

 

아담한 A5 크기에 232쪽 얇은 두께의 책이고

책 제목이 `파이토치 첫걸음`인데...

 

부제목은 엄청나다.

`딥러닝 기초부터 RNN, 오토인코더, GAN 실전 기법까지`

 

즉, 조그마한 책에 너무 많은 것을 알려주려고 한 것이다.

 

 

 

책 제목이 `파이토치 첫걸음`이고

책의 첫 챕터에서 딥러닝이 뭔지 설명해주는 책이기에

딥러닝 어린이가 구매하기를 기대한 것으로 보이는데

그러기에 책 내용은 딥러닝 어린이기 보기에 쉽지 않다.

 

 

당장 챕터3의 `선형회귀분석` 부분을 보면

친절하게도 선형회귀분석이 무엇인지 설명을 해주고 있고

손실함수 및 경사하강법을 이어서 이야기하고

파이토치에서의 경사하강법은 어떻게 하는지 설명을 해주며

소스코드로도 보여주고 있다.

 

하지만,

분명히 차근 차근 밟아나가며 설명을 해주고는 있지만

충분한 설명이라기 보다는 요약 수준이다.

 

설명이 부실하다는 말은 아니다.

깔끔하게 정리된 논문같은 느낌?!

아니면 공부하면서 요약정리한 느낌!?

 

 

 

 

반면, 제공되는 예제 코드가 잘 제공되고 있어서 많은 도움이 된다.

https://bit.ly/2U7ttYT

 

책의 예제 외에도 추가적인 자료도 포함되어 있고

주석도 추가적으로 제공되고 있다.

 

 

 

비교적 얇고 작은 사이즈의 책이기에

가볍게 들고 다니면서 틈날 때마다 한 번 읽어보고

제공되는 예제 코드를 Colab에서

돌려가면서 실습해보고

잘 이해가 안되는 부분들에 대해서는

구글링을 해보며 채워나가면서

공부하면 좋을 것 같다.

 

 

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형

 

"최적의 리액트 코드를 작성하기 위한 모범 사례와 패턴"

 

책의 표지에 적혀있는 문구이다.

 

표지

 

러닝 리액트 - 10점
알렉스 뱅크스.이브 포셀로 지음, 오현석 옮김/한빛미디어

 

 

React를 공부하겠다라고 하면

주변 사람들이 입문서로 가장 많이 추천한 책이었는데,

마침 이번에 새로 개정까지 되었다니~ 금상첨화 !!!

 

 

표지

 

표지를 보면 알겠지만,

21년 7월 1일 1쇄 발행이다!

 

 

이 책의 포지션은 "입문서"이지만,

중급자가 보기에도 나쁘지는 않을 것 같다.

 

CONTENTS

 

목차를 보면

리액트에 대한 소개는 물론이고

변수 선언이나 함수 만들기부터

친절하게 차근 차근 소개를 해주고 있다.

 

 

사실 리액트의 시작은 얼굴책-Facebook이다.

 

Facebook에 적용이 되었다고 하여 유명세를 얻게 되었으며

심지어 별스타그램-Instagram도 리액트로 만들었다고 해서

많은 신도들을 불러들인 라이브러리이다.

 

리액트의 과거와 미래

 

책에서도 이러한 리액트의 역사와 비전에 대해서도

짧게나마 소개해준다.

 

 

요즘 기본이 된 사항이지만

이 책에서 사용된 소스 코드들을

GitHub로 제공해주고 있다.

 

코드 예제

https://github.com/MoonHighway/learning-react

 

MoonHighway/learning-react

The code samples for Learning React by Alex Banks and Eve Porcello, published by O'Reilly Media - MoonHighway/learning-react

github.com

 

 

[ Pros ]

- 리액트 입문자를 위한 친절한 책

: 리액트는 무엇인지, 변수 선언은 어떻게 하는지와 같은

기초적인 것부터 친절하고 쉽게 설명해준다.

 

- 샘플 코드와 결과를 보기 쉽게 제공

: 편집의 힘인 것 같은데,

희한하게 다른 책과 뭐가 다른지 딱 꼬집아 말할 수는 없지만

책을 보면서 소스 코드가 눈에 잘 들어왔다.

그리고 결과 등을 보여주는 부분도 보기 좋았다.

 

- 충실한 github.com 예제/정보 제공

: 예제 코드를 제공해주는 github에 꼭 접속해보기 바란다.

책에서 아쉬운 부분도 많이 채워준다.

Chapter에 맞춰서 꼭 github도 같이 보기를 강력하게 추천한다.

 

[ Cons ]

- 개발환경 구축에 대한 설명 미흡

: 입문자를 위한 책임에도

개발환경을 갖추는 부분에 대한 설명이 조금 부족하다.

없는 것은 아닌데... 아쉽다.

 

- 기능 설명의 나열

: 차근 차근 공부하려는 분들에게는 좋을 수도 있는 부분인데

바로 뭔가 만들면서 공부하는 것을 좋아하는 사람에게는 조금 아쉽다.

사전처럼 필요한 부분을 찾아서 보기에 좋을 수도 있기는 한데...

이 책만 가지고 리액트를 공부하기에는 조금 아쉬울 수 있을 것 같다.

 

[ 총평 ]

- 리액트를 공부하기 시작했다면 꼭 갖고 있기를 추천

클론 코딩과 같은 강의를 들으면서 보면 더더욱 많은 도움이 될 것 같다!

 

 

 

 

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

반응형

APACHE KAFKA 표지

 

이번 달에 보게된 책은

"실전 아파치 카프카(APACHE KAFKA) - 애플리케이션 개발부터 파이프라인, 사물인터넷 데이터 허브 구축까지"

 

개인적으로 KAFKA를 알게된 계기는 MLOps를 처음 공부할 때에

Streaming Data를 수집 및 배포하는 용도의 도구로 처음 접하게 되었었다.

 

Machine Learning에서 대용량의 데이터 특히 지속적으로 제공되는 straming data를 처리할 때,

앞단에 구축하게 되는 시스템으로 가장 추천하는 도구가 바로 Kafka였었다.

 

Apache Kafka

 

책에서 제일 처음 보여주는 그림을 보면, KAFKA의 용도를 정확히 알 수 있다.

 

Kafka는 대량의 데이터를 높은 처리량과 실시간으로 처리하기 위한 도구로써 다음의 4가지 특징이 있다.

 

  - 확장성 : 여러 대의 서버 구성 가능

  - 영속성 : 수신한 데이터를 디스크에 유지 가능

  - 유연성 : 다양한 도구와 연계 가능

  - 신뢰성 : 메시지 전달 보증

 

https://kafka.apache.org/

 

 

Apache Kafka 사이트에 가면, 위와 같은 홍보 문구(?)를 볼 수 있다.

Fortune 100대 기업의 80% 이상에서 사용될 정도로 신뢰성 있고 인기 있는 잘나가는 도구라는 의미이다.

 

 

이렇게 멋진 도구에 대해서 멋지게 잘 소개해주고 있는 책이 바로 이 책이다.

 

실전 아파치 카프카 - 10점
사사키 도루 외 지음, 정인식 옮김, 시모가키 도루 외 감수/한빛미디어

 

 

조금 아쉬운 점은 이 책은 2018년도에 출시된 2.0 버전을 바탕으로 작성되었다는 것인데,

현재 시점 최신 버전은 아직 2.7 이다.

 

초판 1쇄

 

책이 출간된 것도 20년 2월이니까.... 1년이 조금 넘게 된 시점에서 이 책을 보게 되었지만...

Kafka라는 도구 특성상 엄청난 변화가 있는 것은 아니기에 Kafka에 대해서 공부하기에 별 무리는 없을 것으로 본다.

 

 

목차

 

Kafka에 대한 hitstory에 대해서도 친절히 설명해주고 있다.

 

목차

설치나 애플리케이션 구성 등에 대해서도 자세하게 친절하게 잘 되어있다.

 

사례

 

실제 사례에 대해서도 보기 좋게 재미있게 잘 정리되어 있다.

 

 

실무에서 Kafka를 사용해야하는 분들에게 많은 도움이 될 수 있는 책이다.

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형

[ GAN is ... ]

 

AI가 만든 얼굴이라던지, 오바마 전미국대통령의 fake 영상이라던지 하는 뉴스를 들어보았을 것이다.

이런 것들을 만들어낼 수 있는 가장 대표적인 기술적 배경이 바로 GAN 이다.

 

아래 영상을 보면 바로 어떤 것인지 알 수 있다.

 

 

GAN은 "Generative Adversarial Network"의 줄임말인데, 풀어보면 아래와 같이 말할 수 있다.

  • Generative: 생성(Generation) 모델을 이용하여, 진짜 데이터와 같이
  • Adversarial: 두 개의 모델을 적대적(Adversarial)으로 경쟁시키며 발전 시키는
  • Network: 인공신경망(Artificial Neural Network)

 

"GAN"은 라벨(정답)이 없는 데이터를 가지고 학습을 하는 비지도학습의 한 유형이다.

GAN에 대한 가장 대표적인 설명은 "위조지폐범"과 "경찰"이다.

 

GAN

 

위조지폐범(생성모델)은 진짜와 구분이 어렵도록 위조지폐(가짜 데이터)를 계속 생성하고,

경찰(분류모델)은 진짜와 가짜를 계속 분류하면서 50%의 확률 정도가 될 때까지 계속 진행을 하는 방식이다.

 

 

 

[ This book is ... ]

 

서두가 길었다 ^^

 

GAN에 대해서 알려주는 괜찮은 책이 이번에 한빛미디어에서 출간되었다.

책의 제목은 "GAN 첫걸음" !!!

 

GAN 첫걸음 - 표지

 

예쁜 보라색으로 깔끔한 폰트로 제목이 적혀있는 표지를 갖고 있는 조금 작은 크기(신국판 규격 정도?!)의 책이다.

거기에다가 지금 이 글을 적고 있는 시점에서보면 나온지 얼마 안되는 따끈따끈한 책이다.

 

GAN 첫걸음 - 초판

 

이 책의 지은이는 "타리크 라시드"이다.

 

GAN 첫걸음 - 지은이

 

"타리크 라시드"는 이 책에 앞서서 다른 책을 출간했었다.

 

신경망 첫걸음 - 10점
타리크 라시드 지음, 송교석 옮김/한빛미디어

 

어떻게 보면 위 책의 다음 2권과 같은 위치에 있는 것이 바로 이 책 "GAN 첫걸음"인 것 같다.

물론, "신경망 첫걸음"을 보지 않고 바로 "GAN 첫걸음"을 본다고 하여 문제가 되지는 않는다.

 

GAN 첫걸음 - 대상 독자

 

책에 쓰여져 있는 것처럼, 기초부터 알고 싶은 사람을 배려해서 쓰여져 있기 때문이다.

 

하지만, 아무리 그래도 최소한 Machine Learning에 대한 기초적인 지식이 있으면 조금 더 읽기 수월할 것이고

"신경망 첫걸음"을 먼저 읽었다면 더더욱 읽고 이해하기 좋을 것이다.

 

 

[ Prerequisite ]

 

이 책은 기본적으로

"구글 코랩(Google Colab)" 환경에서 "파이토치(PyTorch)" 라이브러리를 이용하여 GAN을 구현한다.

 

친절하게도 이 책에서는 "Chapter1 파이토치 기본"에서

기본적인 실습 환경과 배경 지식에 대해서 친절하게 설명을 해주고 있다.

 

그러다가 PyTorch의 기본 데이터 형태인 텐서(tensor)에 대해서까지 Part1에서 설명을 해준다.

 

 

[ practice ]

 

"Chapter2 파이토치로 만드는 첫 번째 신경망"에서는

유명한 MNIST 데이터셋을 이용해 PyTorch로 신경망을 만드는 과정을 꼼곰히 설명해주고 있다.

 

"Chapter3 성능 향상 기법"에서는 조금 더 성능을 높이기 위한

손실함수, 활성화 함수, 옵티마이저, 정규화 등에 대해서 설명한다.

 

"Chapter4 CUDA 기초"에서는 AI 하면 떠오르는 GPU를

어떻게 사용할 수 있는지에 대해서 친절하게 설명해준다.

 

여기까지가 "Part1 파이토치와 신경망 기초"에 해당한다.

 

 

[ lesson ]

 

본격적인 GAN에 대한 학습은 "Part2 튼튼한 GAN 만들기"로 분류되어 있는

"Chapter5 GAN 개념"부터 "Chapter8 얼굴 이미지"까지로 이루어져 있고,

 

"Part3 흥미로운 GAN 기법"에서는 조금 더 고급스러운(?)

'Chapter9 합성곱 GAN', 'Chapter10 조건부 GAN'에 대해서 설명해주고 있다.

 

 

 

[ My Opinion is ... ]

 

아직 이 책의 끝까지 공부해보지는 못했지만 지금까지 공부하면서 느낀 점을 적어보면...

 

책이 나름 친절하고 쉽게 설명해주고자 노력했지만,

그렇다고 해서 Machine Learning이 뭔지도 공부하지 않은 상태에서 접하기에는 어려울 수 밖에 없다.

 

또한 책에서 심심찮게 보이는 "신경망 첫걸음에서 뭐뭐를 해봤었다"와 같이

이 책을 보기 전에 "신경망 철걸음"을 보고와야 되는 것처럼 되어 있는 점은 조금 아쉬웠다.

 

하지만,

최소한 "Machine Learning"에 대해서 조금이라도 공부를 해보신 분이라면

GAN에 대해서 공부하기 위해 이 책을 추천할 수 있을 것 같다.

 

어려운 수학 공식에 대한 설명 보다는

구글 코랩에서 PyTorch를 직접 구현해보며 공부할 수 있다는 점은 정말 좋았다.

 

직접 해보면서 공부하는 것을 좋아하시는 분에게는 정말 정말 적극 추천한다!!!

 

 

※ 이 책은 한빛출판네트워크의 '나는 리뷰어다' 이벤트를 통해 제공 받은 도서입니다.

반응형

 

머신러닝에 대한 이론 공부만 해서는 실무에서 적용할 때 무쓸모가 될 수도 있기에 😥

실무에 적용을 어떻게 해야하는지에 대해서 살펴보고자 찾던 중 찾게 된 도서 !! 😍

 

"Machine Learning for Business"

 

책 표지

 

왠지 멋지게 생긴 선장 같은 아저씨가 더욱 더 눈길을 잡아끌었다.

 

하지만, 보험약관 처럼 놓친 것이 있었으니...

"아마존 세이지메이커와 주피터를 활용한 빠르고 효과적인 머신러닝 활용법"

 

어쩐지 추천의 글에 있는 2분 모두 AWS코리아 소속이시더라니... 😁

 

 

뭐 하지만, 회사에서도 퍼블릭 클라우드 사용량을 보면 대부분 AWS를 쓰고 있고,

글로벌 트렌드를 봐도 뭐 AWS가 대세이기는하니 ...

이번 기회에 말로만 듣던 세이지메이커 한 번 써보지 뭐 !!! 😑

 

 

우선 AWS 가입부터 해야하는데,

친절하게도 책의 뒷 부분에 있는 '부록'에

"AWS 가입"부터 파일 저장을 위한 S3 설정 및 사용방법, 세이지메이커 설정 등에 대해서 친절히 알려준다.

 

Amazon SageMaker

 

그런데, AWS 서비스 쓰려면 돈드는 것 아닌가!?

본래 처음 가입하면 1년간 어느 정도 사용할 수 있는 무료 정책이 있다지만

나는 이미 무료 1년이 지났는데... 그래서 홈페이지 찾아가봤다.

 

SageMaker 요금제

리전을 서울로 바꾸지는 말자.

시간당 요금이 여기보다 비싸다.

 

그런데, 실제 사용하면 얼마쯤 나온다는 것일까?

 

SageMaker 요금 예제

 

2시간 정도 쓰면 500원쯤 지불한다는거네... 음... 나의 똑똑해짐을 위해 이 정도는 투자해줘도 될 것 같다. 😎

 

뭐, 기본 환경 구축은 이 정도로 하고...

 

 

 

책의 내용을 살펴보자.

 

도서 구성

 

일반적인 회사의 운영 영역을 시나리오로 해서 구성이 되어있다.

 

각 시나리오에 따라 데이터가 제공되고

그 데이터를 모델에 적합한 형태로 가공도 하고

학습/검증/테스트 용도에 맞게 데이터셋 분리도 해보고

시나리오와 데이터에 맞는 머신러닝 알고리즘을 선택해서 학습도 한다.

심지어 AWS 비용 절감을 위한 관리 방법까지도 알려준다.

 

 

다만, 이렇게 실제 머신러닝을 비즈니스에 적용하기 위한 과정을

AWS SageMaker를 이용해서 적용하는 과정에 대해서 설명을 하다보니

머신러닝에 대해서는 많은 분량으로 설명해주지는 않는다.

 

하지만 이 부분은 절대 이 책의 단점이 아니다!!!

 

이 책은 분명히 타이틀에 적어놓은 것 처럼

"비즈니스 머신러닝"에 대한 책이다!!!

 

또한,

"아마존 세이지메이커와 주피터를 활용한 빠르고 효과적인 머신러닝 활용법"에 대해서 알려주는 책이다.

 

 

그리고, 이 책의 경우 원서에는 없는 설명도 포함되어 있다.

 

한국어판 부록

 

IT 서적의 안타까운 부분인데... 대상 시스템이 업그레이드가 되어버려 버전이 맞지 않게 되는 것이다.

하지만, 친절하게도 버전을 맞출 수 있는 방법을 가이드해주고 있다.

 

 

머신러닝에 대해서 기본적인 사항들을 공부하신 분들에게 추천하고픈 책이다.

전체적으로 어떤 흐름으로 비즈니스에 적용하는지 살펴보기에 충분히 괜찮은 책이다.

 

 

※ 이 책은 한빛출판네트워크의 '나는 리뷰어다' 이벤트를 통해 제공 받은 도서입니다.

반응형


이번 달에 리뷰 도서로 당첨된 책은 "데이터 전처리 대전"이다.



데이터 전처리 대전 - 10점
모토하시 도모미쓰 지음, 윤준 옮김/한빛미디어


AI/ML 관련 분야 中 "데이터"에 대한 내용을 담고 있는 책이다.



아직까지도 AI/ML 공부한다고 하면

대뜸 TensorFlow 또는 PyTorch와 같은 것으로

어떻게 Training을 해서 모델을 만들 것인지에 대해서 파고든다.


경사하강법(gradient descent)이 어찌고

오버핏이 어찌고 등등등...



하지만, 제대로된 결과물이 나오기 위해서는

제대로된 입력물이 있어야 한다!!!



즉, 데이터가 중요하다는 말이다 !!!



그러한 데이터를 미리 예쁘고 똑똑하게 처리하는 것이 바로

"데이터 전처리" 이다.






제목도 직관적이고

표지 디자인도 예쁘고

색상도 주황색으로 트랜디 하다!


즉, 책을 딱 보면 괜찮을 것 같다는 기대감을 준다 !!!







원서의 경우 2018년도에 작성이 되었고

번역본은 2019년 11월에 출간이 되었다.

아직 개정판은 없는 것 같다.


음... 시시각각 새로운 것들이 쏟아지는 AI/ML 바닥에서

지금 (20년 11월) 이 책을 봐도 되는 것인지

우려가 되기도 하지만...


데이터를 다루는 부분에 있어서는

책에서 설명하고 있는 내용들이 안될일은 없을 것 같다.


즉, 지금 구매해서 봐도 괜찮다.






이 책은 크게 4개의 파트로 구성되어 있다.


정말 직관적이다.


전처리가 무엇인지 설명해주고 (1부)

구조를 어떻게 손봐야 하는지 알려주고 (2부)

내용도 손봐야 하는 경우 어떻게 할지 알려준 다음에 (3부)

실전에 적용하기 위해 필요한 사항들을 알려준다 (4부)





화려한 것을 좋아하는 개인적인 취향에서 조금 아쉽게도

흑백 인쇄이지만

깔끔한 편집으로

보기 편하게 잘 되어 있다.







번역도 술술 읽힐 정도는 아니지만

그냥 보기에 크게 어색하지 않게 잘 되어 있다.







책 내용은

표지에 명시되어 있는 것처럼


파이썬

SQL

R


3가지 방법으로 설명을 해주고 있다.



즉, 현재 주로 사용하고 있는 언어(도구?)가

저 3가지에 속한다고 하면 아무 부담없이

이 책을 구매해도 될 것 같다.



각 도구(언어?)에 대한 설명은 별도로 없기 때문에

셋 중 하나는 다룰줄 아는 사람에게만

이 책을 권장한다.






이 책에서 사용하는 데이터는 한빛미디어 홈페이지에서 다운로드 받을 수 있다.


http://hanbit.co.kr/support/supplement_survey.html?pcode=B1543811360




역자가 예제 환경 설정 등에 대해서 포스팅을 해준다고 했는데,

1년이 지난 지금까지도 포스팅 안해줬다.


https://junyun0516.github.io/




그냥 데이터나 예제를 github를 통해서 공유해주지....




결론은 ...

1년이 지난 책이지만, 지금 봐도 괜찮은 데이터 전처리 관련 도서이다.






* 이 책은 한빛출판네트워크의 '나는 리뷰어다' 이벤트를 통해 제공 받은 도서입니다.



반응형

+ Recent posts