R로 하는 데이터 시각화 이북 리뷰

R로 하는 데이터 시각화

R로 하는 데이터 시각화는 한빛미디어의 리얼타임 시리즈로 출간된 이북입니다. 데이터 분석 및 시각화에 대한 관심이 있었기에  R 언어를 한번도 경험해 보지 않았음에도 불구하고 겁 없이 이 책을 선택해서 읽었습니다. 다행히 큰 어려움 없이 책을 읽을 수 있었고 이렇게 리뷰를 남깁니다.

이 책은 제목 그대로 정직하게 R을 통해서 데이터 결과물을 어떻게 시각화 할 수 있는지를 알려줍니다. 다행인 것은 저처럼 R을 처음 경험하는 사람들도 읽을 수 있게 2장 “R 프로그래밍 기본”에서 기초부터 차근차근 설명합니다. 물론 책의 주 목적이 R 설명이 아니기 때문에 자세하지는 않습니다.

또한 이 책을 읽으려면 최소한 기본적인 프로그래밍 지식을 가지고 있어야 합니다. 예를 들면 객체, 벡터, 리스트, Call by value나 Call by reference의 용어를 자연스럽게 사용합니다. 따라서 프로그래밍 경험이 없는 분들이 읽기에는 다소 어려움이 있을 수 있습니다. 

R 시각화

이 책의 핵심은 3장부터 소개하는 R을 통해 데이터를 시각화하는 부분입니다. 구체적으로는 ggplot2라는 패키지를 어떻게 다루는 지를 설명합니다. 설명을 위한 모든 예제에 코드가 제공되며 위의 그림처럼 간단히 책의 코드를 Copy&Paste해서 그대로 따라해 볼 수 있습니다.

데이터를 시각화 하는 R의 소스코드는 R을 처음 접하지만 그리 어렵지는 않습니다. 시각화하는 R의 코드는 논리적으로 프로그래밍하는 개념보다는 예를 들자면 MS오피스의 엑셀에서 차트를 그리는 일련의 과정을 GUI로 쉽게하는 것을 R에서 CLI형태로 하는 듯한 느낌일 뿐입니다.

따라서 여러가지 색상, 그래프 형태와 패턴등을 다루는 옵션들이 많기에 한번에 책의 내용을 다 소화할 수도 없습니다. 그때 그때 책의 예제에 소스를 참고로 다른 옵션들을 적용하면서 어떻게 결과가 나오는지를 보면서 학습하면 좋습니다.

책의 예제를 따라하면서 약간 아쉬운 점은 이북의 장점이기도 한 코드를 그대로 Copy&Paste하는 부분이 가끔 에러가 난다는 점입니다.

R 소스 오류

이는 타이포의 문제가 아니라 코드의 내용이 길어 한줄 내려 쓰기 할 때 문법에 맞지 않는 띄어쓰기가 들어있기 때문입니다. 따라서 제대로 실행하려면 R 문법에 맞지 않는 띄어쓰기를 지워야 정상적으로 명령이 실행됩니다. 이북으로 리얼타임시리즈가 갖는 장점이 바로 바로 코드를 옮겨 붙여 실행을 확인해 볼 수 있다는 측면에서 볼 때 약간 아쉬운 점입니다.

전반적인 총평을 하자면,  이 책은 ggplot2 패키지를 활용하여 어떻게 데이터를 시각화하는지에 대한 상세한 설명이 녹아든 책입니다. 더불어 R을 처음 접하는 독자도 감히 도전할 수 있는 책입니다. 다만 처음 R을 하는 사람들은 데이터를 시각화 하기 위한 전처리 작업, 즉 데이터 멍잉에 대한 부분은 좀 더 많은 연습과 준비가 필요한데 이 부분은 이 책의 목적과 거리가 멀어 많이 다루지 않기에 다른 자료나 교재를 통해 추가적인 예제 및 실습을 통한 학습이 요구됩니다.

방 안에서 R과 함께 따듯한 연말과 겨울을 보내봅시다!

R로 하는 데이터 시각화_리뷰