최근에 빅데이터와 관련된 용어들이 많이 사용되고 있다. 인공지능, 머신러닝, 데이터 과학, 데이터 과학자, 4차 산업혁명 등과 같은 단어들을 많이 접하게 된다. 이처럼 많은 사람들이 빅데이터에 관심을 갖고 있지만, 이러한 데이터로부터 의사결정에 도움을 줄 수 있는 유용한 정보를 얻어내는 것은 쉬운 일이 아니다. 실질적으로 데이터를 분석해서 의사결정에 도움을 줄 수 있는 유용한 정보를 찾을 수 있는 능력을 키우기 위해서 기본적인 프로그램 능력과 더불어 다양한 종류의 데이터를 분석하고 필요한 정보를 도출하는 과정을 직접 해볼 수 있어야 한다. R 언어는 이러한 환경을 제공하고 있다.
이 책은 데이터 분석에 처음 입문하는 독자들을 위해서 R 언어의 사용법과 R 언어를 이용한 데이터 분석 과정을 교양 수준으로 집필한 책이다. 단순히 R 함수를 열거하고 프로그램 방법을 소개하는 것이 아니라, R에서 제공하는 데이터 세트를 이용하여 데이터를 분석하는 과정과 결과를 해석하고 필요한 정보를 얻는 방법을 배울 수 있도록 책을 구성하였다. 또한 통계학, 수학, 그리고 프로그램의 기초가 부족한 독자도 어려움 없이 이해할 수 있도록 책 내용을 서술하였다.
이 책은 8장으로 구성되어 있다. 1장에서는 사용자의 컴퓨터 환경에 R과 RStudio를 설치하는 방법을 소개하고, 2장에서는 벡터, 팩터, 행렬, 배열, 데이터 프레임, 데이터 테이블과 리스트 등의 R 데이터 구조를 다룬다. 3장에서는 R 데이터의 조작과 응용을 다루며, 4장에서는 R 프로그램의 조건문과 반복문을 설명하고, 5장에서는 apply 군의 함수와 활용 문제를 다룬다. 6장에서는 R의 기본 그래프 함수와 ggplot2 패키지의 그래프 함수를 이용하여 범주형 데이터를 그래프로 작성하는 방법과 활용을 다루고, 7장에서는 양적 데이터를 그래프로 작성하는 방법과 활용을 다룬다. 마지막으로 8장에서는 기술통계과 응용 사례분석을 다루고 있다.
이 책에서 다룬 R 소스 코드와 데이터 파일 및 출간 후 나올 수 있는 수정사항 등은 자유아카데미 홈페이지(http://www.freeaca.com) 자료실을 통해 내려받을 수 있다.