장바구니 담기 close

장바구니에 상품을 담았습니다.

자바 데이터 분석

자바 데이터 분석

  • 존R.허바드
  • |
  • 에이콘출판
  • |
  • 2019-08-28 출간
  • |
  • 478페이지
  • |
  • 188 X 235 mm
  • |
  • ISBN 9791161753355
판매가

35,000원

즉시할인가

31,500

카드할인

0원(즉시할인 0%)

적립금

1,750원 적립(5%적립)

배송비

무료배송

(제주/도서산간 배송 추가비용:3,000원)

추가혜택

네이버페이 무조건 1%적립+ 추가 1%적립

수량
+ -
총주문금액
31,500

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




★ 이 책에서 다루는 내용 ★

■ 텍스트를 포함한 다양한 크기의 데이터 셋을 분석하는 자바 프로그램 개발
■ 회귀, 분류, 클러스터링 같은 중요한 머신 러닝 알고리즘 구현
■ 데이터 분석과 시각화를 위한 오픈소스 자바 라이브러리와 API를 적용한 인터페이스 개발
■ 관계형 데이터베이스와 NoSQL 데이터베이스를 활용한 시계열 데이터 분석
■ 자바 도구를 사용한 다양한 형식의 데이터 시각화
■ 멀티미디어 데이터 분석 알고리즘과 자바를 사용한 알고리즘 구현

★ 이 책의 대상 독자 ★

이 책은 데이터 분석에 대한 이해를 높이고 해당 분야에서 알고리즘을 구현하는 자바 소프트웨어 개발 능력을 갖춘 학생과 실무자를 대상으로 한다.

★ 이 책의 구성 ★

1장, ‘데이터 분석 개론’에서는 사회 문제를 해결하는 데 있어 데이터 분석의 역사적 발전 과정과 중요성을 설명한다.
2장, ‘데이터 처리’에서는 데이터가 저장되는 다양한 형태를 소개하고, 데이터 셋의 관리 방법과 정렬, 병합, 해싱 같은 기본 처리 기술을 알아본다.
3장, ‘데이터 시각화’에서는 그래프와 표, 시계열 분석, 이동 평균, 정규 및 지수분포 관련 자바 애플리케이션을 다룬다.
4장, ‘통계’에서는 무작위성, 다변량 분포, 이항 분포, 조건부 확률, 독립, 통계 분할표, 베이즈 정리, 공분산과 상관관계, 중심 극한 정리, 신뢰구간 및 가설 검정 등 기본적인 확률 및 통계 이론을 배운다.
5장, ‘관계형 데이터베이스’에서는 외래키와 SQL, 쿼리, JDBC, 배치 작업, 데이터베이스의 뷰, 서브 쿼리, 인덱싱 등 관계형 데이터베이스 접근과 개발에 대해 다룬다. 자바와 JDBC를 사용해 관계형 데이터베이스에 적재된 데이터를 분석하는 방법을 배워보자.
6장, ‘회귀 분석’에서는 선형 회귀, 다항식 회귀, 다중 선형 회귀 분석을 포함한 예측 분석의 중요한 부분을 언급한다. 아파치 커먼즈 매쓰 라이브러리를 사용해 자바에서 회귀 분석을 구현하는 방법을 배워보자.
7장, ‘분류 분석’에서는 결정 트리, 엔트로피, ID3 알고리즘, ARFF 파일, 베이지안 분류기, 서포트 벡터 머신 알고리즘, 로지스틱 회귀, K-최근접 이웃 알고리즘, 퍼지 분류 알고리즘에 대해 다룬다. 웨카 라이브러리를 사용해 자바에서 이러한 알고리즘을 구현하는 방법을 알아보자.
8장, ‘클러스터 분석’에서는 계층적 클러스터링, K-평균 클러스터링, K-중간점 클러스터링, 유사성 전파 클러스터링을 알아본다. 역시나 웨카 라이브러리를 사용해 자바로 구현해보자.
9장, 추천 시스템에서는 유틸리티 행렬, 유사도 측정, 코사인 유사도, 아마존의 아이템 기반 추천 시스템, 대용량 희소 행렬 및 넷플릭스의 경연 역사를 다룬다.
10장, ‘NoSQL 데이터베이스’에서는 몽고DB 데이터베이스 시스템을 중심으로 지형 공간 데이터베이스를 포함한 자바 개발 방법을 알아본다.
11장, ‘빅데이터 분석’에서는 구글의 페이지랭크 알고리즘과 맵리듀스 프레임워크를 알아볼 것이다. 특히 단어 수 세기(WordCount) 예제와 행렬 곱 예제를 통해 자바로 위 알고리즘과 프레임워크를 구현하는 방법을 알아본다.
부록, ‘자바 도구’에서는 이 책에서 사용하는 모든 소프트웨어, 즉 이클립스, MySQL, 몽고DB의 설치 방법을 정리했다.

★ 옮긴이의 말 ★

다양한 솔루션과 시스템을 구성 및 개발하는 프로젝트를 진행하며 절실히 깨달은 사실이 하나 있다. 바로 많은 데이터를 보유하고, 보유한 데이터를 적절히 사용할 줄 아는 기업이 결국 좋은 시스템과 솔루션을 보유하게 된다는 것이다.
데이터를 잘 활용해 글로벌 기업이 된 가장 대표적인 예가 구글이라고 생각한다. 구글은 전 세계의 웹 데이터를 모아 자신의 데이터로 만들었으며, 그저 데이터를 모으는 데 그치지 않고 다양한 기술과 비즈니스를 개발하는 데 활용했다.
기술이 발전할수록 데이터의 중요성은 나날이 증가하고 있고, 데이터의 양도 중요성에 비례해 증가하고 있다. 데이터를 분석해 가치 있는 뭔가를 발견하는 것이 점점 더 중요해지는 이유다.
일반적으로 데이터 분석 시 R이나 파이썬 같은 언어를 많이 사용한다. 자바는 어느 언어보다 거대하고 다양한 오픈소스 생태계를 갖고 있고, 다양한 플랫폼에서 하나의 소스로 동작한다는 이점을 갖고 있다. 이러한 자바의 강점을 기반으로 데이터 분석 영역에서도 자바가 훌륭한 도구로 사용될 수 있음을 이 책을 통해 알 수 있다.
자바가 데이터 분석에 활용하기에는 부족하다는 인식이 바뀌어 좀 더 많은 곳에서 자바로 데이터 분석을 수행하는 모습을 볼 수 있기를 바란다.


목차


1장. 데이터 분석 개론
__데이터 분석의 기원
__과학적 방법
__보험학
__증기로 계산
__멋진 예시
__허먼 홀러리스
__에니악
__비지칼크
__데이터, 정보, 지식
__왜 자바인가?
__자바 통합 개발 환경
__요약

__2장. 데이터 처리
__데이터 유형
__변수
__데이터 요소와 데이터 셋
__데이터 요소와 데이터 셋
____널 값
__관계형 데이터베이스 테이블
____키 필드
____키-값 쌍
__해시 테이블
__파일 형식
____마이크로소프트 엑셀 데이터
____XML과 JSON 데이터
__테스트 데이터 셋 생성
____메타데이터
____데이터 클리닝
____데이터 스케일링
____데이터 필터링
____정렬
____병합
____해싱
__요약

3장. 데이터 시각화
__테이블과 그래프
____산점도
____선그래프
____막대그래프
____히스토그램
__시계열 데이터
__자바 구현체
__이동 평균
__데이터 순위
__도수 분포
__정규 분포
____사고 실험
__지수 분포
__자바 예제
__요약

4장. 통계
__기술 통계
__임의 추출
__확률 변수
__확률 분포
__누적 분포
__이항 분포
__다변량 분포
__조건부 확률
__확률적 이벤트의 독립
__분할표
__베이즈 정리
__상관계수와 공분산
__표준 정규 분포
__중심 극한 정리
__신뢰 구간
__가설 검정
__요약

5장. 관계형 데이터베이스
__관계 데이터 모델
__관계형 데이터베이스
__외래키
__관계형 데이터베이스 디자인
____데이터베이스 생성
____SQL 명령문
____데이터베이스에 데이터 입력
____데이터베이스 쿼리
____SQL 데이터 유형
____JDBC
____JDBC의 PreparedStatement 사용하기
____배치 처리
____데이터베이스 뷰
____서브쿼리
____테이블 인덱스
__요약

6장. 회귀 분석
__선형 회귀
____엑셀에서의 선형 회귀
____회귀 상관계수 계산
____분산 분석
____선형 회귀 자바 구현
____앤스콤 쿼텟
__다항식 회귀
____다중선형회귀분석
____아파치 커먼즈 구현
____곡선 적합
__요약

7장. 분류 분석
__의사 결정 트리
____의사결정 트리와 엔트로피와의 관계
____ID3 알고리즘
__웨카 플랫폼
____ARFF 파일 유형
____웨카를 사용한 자바 구현
__베이지안 분류기
____웨카를 사용한 자바 구현
____서포트 벡터 머신 알고리즘
__로지스틱 회귀
____K-최근접 이웃 알고리즘
____퍼지 분류 알고리즘
__요약

8장. 클러스터 분석
__거리 측정
__차원의 저주
__계층적 클러스터링
____웨카 구현
____K-평균 클러스터링
____K-중간점 클러스터링
____유사성 전파 클러스터링
__요약

9장. 추천 시스템
__유틸리티 행렬
__유사도 측정
__코사인 유사도
__간단한 추천 시스템
__아마존 아이템 기반 협업 필터링
__사용자 등급 구현
__거대 희소 행렬
__임의 접근 파일 사용
__넷플릭스 경진대회
__요약

10장. NoSQL 데이터베이스
__맵 데이터 구조
__SQL과 NoSQL
__몽고 데이터베이스 시스템
__도서관 데이터베이스
__몽고DB를 사용한 자바 개발
__지리 정보 데이터베이스를 위한 몽고DB 확장
__몽고DB에서의 인덱스
__왜 NoSQL인가? 왜 몽고DB인가?
__타 NoSQL 데이터베이스 시스템
__요약

11장. 빅데이터 분석
__확장, 데이터 스트라이핑, 샤딩
__구글 페이지랭크 알고리즘
__구글 맵 리듀스 프레임워크
__맵 리듀스 애플리케이션 예제
__워드카운트 예제
__확장성
__맵 리듀스를 사용한 행렬 곱
__몽고DB에서의 맵 리듀스
__아파치 하둡
__하둡 맵 리듀스
__요약

부록. 자바 도구
__명령창
__자바
__이클립스
__MySQL
__MySQL 워크벤치
__이클립스에서 MySQL 데이터베이스 접근
__몽고DB

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.