장바구니 담기 close

장바구니에 상품을 담았습니다.

Pandas로 하는 데이터 과학

Pandas로 하는 데이터 과학

  • 마이클헤이트
  • |
  • 에이콘출판
  • |
  • 2018-09-27 출간
  • |
  • 472페이지
  • |
  • 188 X 235 mm
  • |
  • ISBN 9791161752136
판매가

35,000원

즉시할인가

31,500

카드할인

0원(즉시할인 0%)

적립금

1,750원 적립(5%적립)

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

추가혜택

네이버페이 무조건 1%적립+ 추가 1%적립

수량
+ -
총주문금액
31,500

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




★ 이 책에서 다루는 내용 ★

■ 데이터 분석가와 과학자가 데이터를 수집하고 파악하는 방식의 이해
■ 데이터 분석의 처음부터 끝까지 지원하는 Pandas의 활용
■ 시리즈와 데이터 프레임을 사용한 단변량과 다변량 데이터 표현
■ 데이터의 분할과 분리, 여러 출처의 데이터 조합, 그룹화, 집계 방법
■ 파일, 데이터베이스, 웹 서비스 등의 외부 데이터 접근
■ 시계열 데이터의 표현, 조작, 다양한 의미 파악
■ 통계 정보의 시각화
■ Pandas를 이용한 다양한 금융 데이터 표현과 분석


★ 이 책의 대상 독자 ★

Pandas를 이용한 데이터 분석에 빠져보고 싶은 데이터 과학자, 데이터 분석가, 파이썬 프로그래머 또는 데이터 분석에 관심이 있는 누구에게나 적합하다. 통계와 프로그래밍에 대한 약간의 지식이 있다면 더욱 도움이 되겠지만, 반드시 필요한 조건은 아니다. Pandas에 대한 경험 역시 필요하지 않다.


★ 이 책의 구성 ★

1장, ‘Pandas와 데이터 분석’에서는 Pandas의 주요 특징을 소개한다. 1장의 목적은 통계와 데이터 과학의 맥락에서 Pandas의 역할을 제시하는 것이다. 즉, 데이터 과학과 관련한 여러 개념을 알아보고 이를 Pandas가 어떻게 지원하는지 설명한다. 이로써 데이터 과학과 데이터 과학 프로세스와 관련한 이후의 각 장을 공부할 준비를 갖춘다.
2장, ‘Pandas의 설치와 가동’에서는 Pandas를 다운로드해 설치하는 방법과 몇 가지 기본 개념을 알아본다. 또한 iPython과 주피터 노트북(Jupyter Notebook)을 사용해 실습을 진행하는 모습을 보여준다.
3장, ‘Series로 단변량 데이터 표현’에서는 인덱스를 갖는 1차원의 데이터 표현 방법인 Pandas의 Series로 작업을 시작한다. Series 객체를 만드는 방법과 그 안의 데이터를 조작하는 방법을 공부할 것이며, 추가로 인덱싱, 데이터 정렬, 슬라이싱 등에 대해 알아본다.
4장, ‘DataFrame으로 다변량 데이터 표현’에서는 인덱스를 갖는 2차원의 데이터 표현 방법인 Pandas의 DataFrame에 대해 알아본다. DataFrame 객체를 만드는 방법과 정적 데이터셋의 사용 방법, 특정 칼럼이나 로우를 선택하는 방법 등을 배운다.
5장, ‘DataFrame 구조 다루기’에서는 4장에서 한 걸음 더 나아가 DataFrame으로 좀 복잡한 작업을 수행해본다. 구체적으로는 칼럼이나 로우를 추가, 교체, 삭제해보며, DataFrame 안의 데이터를 조작해본다.
6장, ‘데이터 인덱싱’에서는 Pandas의 인덱스 활용 방법을 자세히 알아본다. 특히 각 인덱스의 유형과 설정, 계층형 인덱스를 다루는 방법을 배운다.
7장, ‘범주형 데이터’에서는 Categorical을 사용해 Pandas의 범주를 다루는 방법을 알아본다.
8장, ‘수치 해석과 통계 기법’에서는 기본적인 산술 연산은 물론 기술 통계, 이산화, 롤링 윈도우, 무작위 표집 등 다양한 통계 작업을 수행해본다.
9장, ‘데이터 접근’에서는 외부로부터 데이터를 로딩해 Series나 DataFrame으로 저장하는 방법을 배운다. 또한 파일, HTTP 서버, 데이터베이스, 웹 서비스 등 다양한 장소의 데이터에 접근하는 방법을 알아본다. CSV, HTML, JSON, HDF5 형식의 데이터를 처리하는 방법도 배운다.
10장, ‘데이터 정돈’에서는 Pandas가 제공하는 다양한 도구를 사용해 지저분하거나 누락된 데이터를 분석에 유용한 형태로 관리하는 방법을 공부한다.
11장, ‘데이터의 조합, 연관, 재형성’에서는 복수의 Pandas 객체로부터 데이터를 접합하거나 병합하는 다양한 기법을 배운다.
12장, ‘데이터 집계’에서는 데이터의 그룹화와 집계 분석에 대해 알아본다. Pandas에서는 이를 분할-적용-재조합 패턴이라고 하는데, 이 패턴을 사용해 여러 방법으로 데이터 그룹화를 수행해보고 집계 함수를 적용해 데이터를 처리해본다.
13장, ‘시계열 모델링’에서는 시계열 데이터에 관해 알아본다. Pandas가 제공하는 방대한 기능을 사용해 시계열 데이터를 다루고 분석하는 방법을 공부한다.
14장, ‘시각화’에서는 matplotlib을 중심으로 Pandas 데이터를 시각화하는 방법을 알아본다. 막대그래프, 히스토그램, 박스-수염 그래프, 영역 그래프, 산점도, 커널 밀도 추정 차트, 히트맵 등 일반적인 여러 차트를 통해 금융 데이터를 표현하는 방법을 알아본다.
15장, ‘과거 주가 분석’에서는 기본적인 금융 분석 기법을 알아본다. 구글 파이낸스(Google Finance)로부터 데이터를 가져와 수익률, 이동 평균, 변동성 등 여러 주제를 다루며, 그런 금융 개념에 시각화를 적용하는 방법도 알아본다.


목차


1장. pandas와 데이터 분석
__pandas 소개
__데이터 조작, 분석, 과학과 pandas
____데이터 조작
____데이터 분석
____데이터 과학
____pandas의 적정 영역
__데이터 분석 프로세스
____프로세스
__이 책에서 각 단계의 관련 위치
__pandas 여행을 위한 데이터와 분석의 개념
____데이터 유형
____변수
____시계열 데이터
____분석과 통계의 기초 개념
__기타 유용한 파이썬 라이브러리
____수학과 과학: NumPy와 SciPy
____통계 분석: StatsModels
____머신 러닝: scikit-learn
____스토캐스틱 베이지안 모델링: PyMC
____데이터 시각화: matplotlib과 seaborn
__정리

2장. pandas의 설치와 가동
__아나콘다 설치
__아이파이썬과 주피터 노트북
____아이파이썬
____주피터 노트북
__pandas Series와 데이터 프레임 소개
____pandas의 임포트
____pandas Series
____pandas DataFrame
____데이터 프레임으로 파일 데이터 로딩
__시각화
__정리

3장. Series로 단변량 데이터 표현
__pandas 설정
__Series 생성
____파이썬 리스트와 딕셔너리를 사용한 생성
____NumPy 함수를 사용한 생성
____스칼라 값을 사용한 생성
__.index와 .values 속성
__Series의 크기와 형태
__생성 시 인덱스 지정
__head, tail, take
__레이블과 포지션으로 값 가져오기
____[] 연산자와 .ix[] 속성을 사용하는 레이블 검색
____.iloc[]을 사용하는 명시적 포지션 검색
____.loc[]을 사용하는 명시적 레이블 검색
__서브셋으로 Series 슬라이싱
__인덱스 레이블을 통한 정렬
__불리언 선택
__리인덱싱
__시리즈 즉석 변경
__정리

4장. DataFrame으로 단변량 데이터 표현
__pandas 설정
__데이터 프레임 객체 생성
____NumPy 함수로 데이터 프레임 만들기
____파이썬 딕셔너리와 pandas Series로 DataFrame 만들기
____CSV로 DataFrame 만들기
__DataFrame 안의 데이터 접근
____DataFrame의 칼럼 선택
____데이터 프레임의 로우 선택
____.at[]이나 .iat[]을 사용해 레이블이나 위치로 스칼라 검색
____[] 연산자를 사용한 슬라이싱
__불리언 선택을 통한 로우 선택
__로우와 칼럼의 동시 선택
__정리

5장. DataFrame 구조 다루기
__pandas 설정
__칼럼명 변경
__[]와 .insert()를 사용한 칼럼 추가
__확장을 통한 칼럼 추가
__접합을 통한 칼럼 추가
__칼럼 재배열
__칼럼의 콘텐츠 교체
__칼럼 삭제
__새 로우 추가
__로우 접합
__확장을 통한 로우 추가 및 교체
__을 .drop() 사용한 로우 삭제
__불리언 선택을 통한 로우 삭제
__슬라이싱을 통한 로우 삭제
__정리

6장. 데이터 인덱싱
__pandas 설정
__인덱스의 중요성
__인덱스 유형
____기본 유형: Index
____정수 유형: Int64Index와 RangeIndex
____부동소수점 유형: Float64Index
____이산 간격 유형: IntervalIndex
____범주형: CategoricalIndex
____날짜 및 시간 유형: DatetimeIndex
____기간 유형: PeriodIndex
__인덱스로 작업
____시리즈와 데이터 프레임에서의 인덱스 생성과 사용
____인덱스로 값 선택
____인덱스 사이의 데이터 이동
____pandas 객체의 리인덱싱
__계층형 인덱스
__정리

7장. 범주형 데이터
__pandas 설정
__Categorical 생성
__범주 이름 변경
__새 범주 추가
__범주 삭제
__미사용 범주 삭제
__범주 설정
__Categorical의 기술 통계 정보
__성적 데이터 가공
__정리


8장. 수치 해석과 통계 기법
__pandas 설정
__수치 계산법
____DataFrame과 Series의 산술 연산
____값의 개수 세기
____고윳값과 그 개수
____최솟값과 최댓값 찾기
____n개 최솟값과 n개 최댓값 찾기
____누적 값 계산
__pandas 객체의 통계 처리
____약식 기술 통계
____중심 경향성 측정: 평균, 중위수, 최빈수
____분산과 표준 편차 계산
____공분산과 상관관계
____이산화와 분위수
____값 순위 계산
____각 표본의 변동률 계산
____롤링 윈도우 작업
____무작위 표집
__정리

9장. 데이터 접근
__pandas 설정
__CSV, 텍스트, 테이블 형식의 데이터
____CSV 데이터셋 예제 확인
____CSV를 데이터 프레임으로 로딩
____CSV 로딩 시 인덱스 칼럼 지정
____데이터 타입의 추론과 지정
____칼럼명 지정
____특정 칼럼의 로딩
____데이터 프레임을 CSV 파일로 저장
____필드 구분 데이터로 작업
____필드 구분 데이터의 다양한 형식 다루기
__엑셀 데이터의 읽기와 쓰기
__JSON 파일의 읽기와 쓰기
__HTML 데이터 읽기
__HDF5 파일의 읽기와 쓰기
__웹을 통한 CSV 데이터 접근
__데이터베이스의 읽기와 쓰기
__원격 데이터 서비스로부터 데이터 읽기
____야후!와 구글로부터 주식 데이터 읽기
____구글 파이낸스의 옵션 데이터 가져오기
____세인트루이스 연방준비은행의 FRED 데이터 가져오기
____케네스 프렌치 데이터에 접근
____세계은행의 데이터 읽기
__정리

10장. 데이터 정돈
__pandas 설정
__데이터 정돈이란?
__결측 데이터 다루기
____NaN 값 찾기
____결측 데이터의 판별과 삭제
____수학 연산에서의 NaN 처리 방식
____결측 데이터 보강
____결측 값 채우기
____인덱스 레이블을 사용한 채우기
____보간법을 사용한 결측 값 채우기
__중복 데이터 다루기
__데이터 변형
____데이터를 다른 인덱스에 매핑
____데이터 대체
____데이터 변형을 위한 함수 적용
__정리

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.