장바구니 담기 close

장바구니에 상품을 담았습니다.

Amazon Redshift

Amazon Redshift

  • 김현준
  • |
  • 에이콘출판
  • |
  • 2019-10-31 출간
  • |
  • 324페이지
  • |
  • 188 X 235 X 19 mm
  • |
  • ISBN 9791161753591
판매가

30,000원

즉시할인가

27,000

카드할인

0원(즉시할인 0%)

적립금

1,500원 적립(5%적립)

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

추가혜택

네이버페이 무조건 1%적립+ 추가 1%적립

수량
+ -
총주문금액
27,000

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




★ 이 책에서 다루는 내용 ★
■ 데이터 분석에 맞춤화된 실습용 레드시프트 클러스터 생성
■ 다양한 형식의 데이터를 적재하고 최적화하는 방법
■ 실습 데이터를 이용해 최적화한 테이블 분산 방식과 소트키 선정 방법
■ 레드시프트 쿼리 프로파일링 방법
■ 레드시프트 쿼리 튜닝 노하우
■ 안정적인 레드시프트 클러스터 구성과 관리, 모니터링 방법
■ 레드시프트 WLM과 스냅샷, VACUUM 작업 100% 이해하기
■ 레드시프트 정보 보안 수준 향상 방법
■ 레드시프트 스펙트럼을 활용한 S3 데이터 쿼리 방법
■ 레드시프트 과금 방식과 비용 절감 방법
■ 일래스틱 리사이즈와 컨커런시 스케일

★ 이 책의 대상 독자 ★
AWS에서 레드시프트를 처음 들어본 사용자부터 레드시프트를 사용해 AWS 내에서 데이터 웨어하우스를 구축하고자 하는 데이터 엔지니어까지 모두 참고할 수 있다. 기존 데이터베이스 관련 지식이 있다면 아마존 레드시프트에서 다른 아키텍처를 어떻게 사용해야 성능의 이점을 최대화할 수 있는지 참고할 수 있다. 데이터베이스 관련 지식이 부족하더라도 기본적인 쿼리 사용법부터 레드시프트 구조까지 자세히 설명하기 때문에 기초 사용자의 레드시프트를 사용 길잡이가 돼줄 것이다. AWS 클라우드에서 데이터 웨어하우스 및 데이터레이크를 구축하고자 하는 엔지니어라면 레드시프트의 특징을 기반으로 저자의 많은 시행착오와 경험에서 나오는 팁들을 참고할 수 있으며, 이 책이 앞으로 겪게 될 폭풍 속의 등대가 돼줄 것이다. 또한 클라우드에 시스템을 구축하는 만큼 얼마나 적은 비용으로 최대한의 효과를 낼 수 있는가에 초점을 맞추고 있다. 아마존 레드시프트를 사용할 때의 여러 팁을 사용자의 환경에 맞춰 적용함으로써 비용 효율적인 시스템을 구축할 수 있도록 안내할 것이다.

★ 이 책의 구성 ★
각 장에서 다루는 내용은 레드시프트 클러스터 구축 과정 순서로 구성했다. 독자에 따라 필요한 장만 읽어볼 수도 있지만 설치형 데이터 웨어하우스와 다르게 클라우드 데이터 웨어하우스에서는 시스템 관리자와 데이터 제공자, 분석가의 경계가 미미하다. 시스템 관리자와 데이터 제공자는 분석가의 쿼리를 잘 알고 있어야 하며, 분석가는 클러스터와 데이터 구성을 잘 이해하고 있어야 최적화된 쿼리 성능을 발휘할 수 있다. 따라서 사용자 역할에 상관없이 처음부터 끝까지 읽기를 권장한다.

1장. AWS 소개
아마존 레드시프트를 다루기 전에 AWS 서비스의 간략한 소개와 출시 배경을 다룬다.

2장. 레드시프트 시작하기
AWS를 처음 접하거나 레드시프트 클러스터를 처음 생성한다면 생성 과정에 등장하는 용어와 옵션이 생소할 것이다. 레드시프트 시스템 아키텍처를 설명하고 AWS 클라우드와 데이터레이크에서 레드시프트의 역할을 이해한 다음 대용량 데이터 분석 환경에 맞춤화된 레드시프트 클러스터 구성 과정을 설명한다.

3장. 데이터 최적화
레드시프트 클러스터가 준비됐다면, 데이터 웨어하우스와 마트 데이터를 구성할 단계다. 데이터 적재부터 데이터 최적화까지 다룬다. 레드시프트에서 데이터 최적화는 쿼리 성능을 결정하는 가장 중요한 단계다. 많은 레드시프트 입문자가 어려워하는 테이블 분산 방식과 소트키를 설명한다. 3장에서 적재한 실습 데이터는 이후 학습 과정에서 활용한다.

4장. 쿼리 최적화
레드시프트와 같이 대용량 데이터를 대상으로 쿼리를 처리하는 데이터베이스 시스템에서의 쿼리 튜닝 작업은 매우 중요하다. 1만 레코드를 대상으로 한 쿼리가 튜닝을 통해 1초 빨라졌다고 가정하면 데이터가 백만, 천만, 1조 건으로 늘어나는 경우 튜닝의 결과는 백 배 천 배로 빨라질 수 있다. 4장에서는 쿼리를 분석하고 프로파일링한 다음 쿼리를 튜닝하는 노하우를 소개한다.

5장. 클러스터 최적화
2장에서 생성한 클러스터를 관리하고 시스템과 데이터 안정성을 높게 유지하는 방법을 설명한다. 또한 많은 레드시프트 입문자가 어려워하는 WLM 구성과 VACUUM 작업을 설명한다.

6장. 레드시프트 보안
레드시프트 클러스터를 관리하고 확장하려면 정보 보안을 간과할 수 없다. 6장에서는 레드시프트 관련 AWS 네트워크 기능을 소개한다. 그 후 사용자 인증과 권한 설정을 통해 데이터 접근을 통제하고, 클러스터와 S3에 저장되는 데이터 암호화로 정보 보안 수준을 높인다. 마지막으로 SSL 클라이언트 연결을 설정해 클라이언트와 클러스터 간 데이터가 안전하게 전송되게 한다.

7장. 레드시프트 스펙트럼
레드시프트 스펙트럼은 AWS S3 데이터레이크와 레드시프트를 연결해주는 고리다. 레드시프트 스펙트럼으로 S3에 저장된 데이터를 쿼리하고 분석하는 방법을 설명하며, 스펙트럼 관련 요금과 비용 절감 방법을 소개한다.

8장. 부록
일래스틱 리사이즈, 컨커런시 스케일과 같이 레드시프트에 새롭게 추가됐지만 학습에 빠트릴 수 없는 기능을 다룬다. 일래스틱 리사이즈를 사용해 클러스터를 재생성하지 않고 클러스터 크기를 변경할 수 있으며, 컨커런시 스케일은 레드시프트 고질적인 컨커런시 제한 문제를 해결해준다. 추가로 레드시프트와 연동되는 AWS 서비스인 AWS Glue와 AWS Athena를 소개한다. 마지막으로 AWS 사용자의 최대 관심사인 레드시프트 요금과 비용 절감 방법을 설명한다.


목차


CHAPTER 1. AWS 소개

__1.1 클라우드 서비스
__1.2 클라우드 요금 제도
__1.3 고객 지원과 마케팅
____AWS re:Invent
____AWS Summit
____AWS TechConnect
____AWS Transformation Days
____AWS Online Tech Talks
____오픈소스
____API & SDK
____AWS 교육과 자격증
__1.4 지속적인 서비스 진화
__1.5 글로벌 가용성
__1.6 시스템 보안
__1.7 정리


CHAPTER 2. 레드시프트 시작하기

__2.1 Amazon Redshift
____레드시프트의 특징
____레드시프트 포지셔닝
__2.2 시작하기
____AWS 웹 콘솔 접속
____레드시프트 클러스터 생성
____노드 유형
__2.3 접속하기
____데이터베이스 툴
____JDBC 접속
____ODBC 접속
____Python 접속
____CLI 접속
__2.4 레드시프트 아키텍처
____시스템 아키텍처
____데이터 분산
____데이터 저장
__2.5 정리


CHAPTER 3. 데이터 최적화

__3.1 실습 데이터 적재
__3.2 테이블 생성
____CREATE TABLE
____CREATE TABLE AS
____CREATE TABLE LIKE
____CREATE TEMP TABLE
____CREATE TABLE IF NOT EXISTS
____테이블 생성 제약 사항
__3.3 컬럼
____데이터 자료형
____컬럼 인코딩
__3.4 데이터 분산
____테이블 분산 방식
____테이블 분산 방식 선택하기
__3.5 소트키
____존맵(Zone Map)
____컴파운드 소트키(COMPOUND SORT KEY)
____인터리브 소트키(INTERLEAVED SORT KEY)
____소트키 유형 선택하기
__3.6 데이터 적재와 추출
____COPY
____UNLOAD
__3.7 정리


CHAPTER 4. 쿼리 최적화

__4.1 SQL 복습
____WHERE
____GROUP BY
____JOIN
____쿼리 강제 종료
__4.2 쿼리 분석
____쿼리 플래닝
____실행 계획 분석하기
____오퍼레이터
____종료된 쿼리 분석하기
____시스템 점유율 분석하기
__4.3 쿼리 튜닝
____쿼리 패턴 분석과 테이블 디자인
____컬럼 프로젝션
____데이터 스캔 줄이기
____조건절에 함수 피하기
____GROUP BY 튜닝
____커밋 빈도 줄이기
____통계 정보 최신으로 유지하기
____데이터 재 분산 & 재 배포 피하기
____쿼리 결과 최소화하기
__4.4 정리


CHAPTER 5. 클러스터 최적화

__5.1 클러스터 설정
____관리자 뷰
____시스템 테이블
____파라미터 그룹
____WLM
____스냅샷
__5.2 클러스터 모니터링
____레드시프트 웹 콘솔 모니터링
____Audit 로깅
____레드시프트 어드바이저
__5.3 테이블 최적화
____ANALYZE
____VACUUM
____딥 카피
____데이터의 균형
__5.4 클러스터 자동화
____AWS Lambda
____CloudWatch Events
__5.5 정리


CHAPTER 6. 레드시프트 보안

__6.1 레드시프트 네트워크 인프라
____네트워크 플랫폼
____VPC & 서브넷
____라우팅 테이블
____인터넷 게이트웨이
____NAT 게이트웨이
____VPN(Virtual Private Network)
____VPC Endpoints(PrivateLink)
____네트워크 방화벽
__6.2 사용자 인증
____사용자 생성
____그룹 생성
____사용자 인증 보안
__6.3 사용자 권한
____테이블 권한
____스키마 권한
____데이터베이스 권한
____함수 권한
____UDF 언어 권한
____권환 회수
__6.4 데이터 보안
____데이터베이스 암호화
____S3 데이터 암호화
__6.5 SSL
____SSL 연결
____SSL 인증서
____Trust Store
____클러스터 설정
____클라이언트 설정
__6.6 정리


CHAPTER 7. 레드시프트 스펙트럼 사용하기

__7.1 레드시프트 Spectrum
__7.2 스펙트럼 구성하기
____IAM 역할 설정하기
____외부 스키마 생성하기
____외부 테이블 생성하기
____메타데이터 저장소
____테이블 파티셔닝
__7.3 스펙트럼 쿼리 작성하기
____외부 테이블 조회 쿼리 및 비교
____내부 테이블과 외부 테이블의 조인
__7.4 스펙트럼 비용
__7.5 레드시프트 스펙트럼 최적화
____최적화된 데이터 포맷 사용
____압축 파일 사용
____대량 병렬 처리를 위한 파일 분할
____데이터 파티셔닝
__7.6 정리


CHAPTER 8. 부록

__8.1 클러스터 리사이즈
____클래식 리사이즈
____스냅샷 리사이즈
____일래스틱 리사이즈
__8.2 컨커런시 스케일
____컨커런시 스케일 요금
__8.3 AWS Glue
__8.4 Amazon Athena
__8.5 레드시프트 비용
____온디맨드 요금
____리저브드 인스턴스 요금
____레드시프트 비용 절약 방법

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.