개발자 맛과책
2015.08.06 / 17:15

Do it! 직접 해보는 하둡 프로그래밍

조회 수 7 추천 수 104 링크


Do it! 직접 해보는 하둡 프로그래밍


하둡을 만든 더그 커팅과 함께 일한 저자가 집필한 하둡 입문서. 방대한 하둡의 핵심을 정확하게 짚어 체계적으로 설명한 후, 하둡의 기초부터 고급 프로그래밍까지 단계별로 따라할 수 있도록 구성했다. 특히 하둡을 수박 겉핥기로 설명하지 않고 저자가 제시한 실습용 데이터를 가지고 직접 따라해볼 수 있도록 구성된 것도 장점이다. 기존의 검색 프로그램과 하둡 프로그램의 비교를 통해 하둡의 우수함을 확인할 수 있도록 1GB의 대용량 데이터를 사용하여 빅데이터를 체험할 수 있을 것이다. 이 책의 예제 곳곳에서 저자의 실무 경험이 배어나온다.

첫째마당
빅데이터와 하둡 이해하기

01장 빅데이터란? 
01-1 빅데이터의 정의
01-2 빅데이터의 예 
01-3 빅데이터 시스템의 구성
01-4 몇 가지 성공 스토리들 
01-5 빅데이터 시스템 도입에서 얻은 교훈과 문제점 
01-6 빅데이터 시장에서 중요한 역할을 하는 기관/회사들 
마무리

02장 하둡 이해하기 
02-1 하둡이란?
02-2 하둡 아키텍처
02-3 HDFS 개요
02-4 MapReduce 프레임워크
02-5 MapReduce 사용 적합 분야와 부적합 분야
마무리 

3장 하둡 설치하기
03-1 설치 환경 
03-2 하둡 다운로드 및 필요 소프트웨어 설치
03-3 독자 모드 설치와 확인 
03-4 의사 분산 모드 설치와 확인 
마무리 

4장 첫 번째 MapReduce 프로그래밍 - WordCount 
04-1 맵과 리듀스
04-2 WordCount 프로그램이란?
04-3 자바 MapReduce 프로그램의 기본 골격
04-4 WordCount 소스 프로그램 보기 
04-5 WordCount 프로그램의 컴파일과 실행
04-6 전체 소스 코드 리스트 
마무리 

둘째마당 
자바 MapReduce 프로그래밍

05장 WordCount 프로그램 자세히 보기
05-1 맵 클래스 다시 살펴보기 
05-2 MapReduce 프로그래밍에서 사용되는 변수 타입들 
05-3 입력 포맷의 역할
05-4 컴바이너란? 
05-5 셔플링과 소팅
05-6 리듀스 클래스 자세히 보기
05-7 출력 포맷
05-8 카운터 
05-9 MRUnit과 메이븐 
05-10 잡 트래커 웹 인터페이스 
마무리 

06장 기본 MapReduce 프로그래밍
06-1 사용 데이터 설명
06-2 WordCount 2 프로그램 
06-3 TopN 프로그램 
06-4 Count Trigram 프로그램 
06-5 Count Citation 프로그램 
06-6 Join ID & Title 프로그램
마무리 

07장 고급 MapReduce 프로그래밍 
07-1 MapReduce 프레임워크를 이용한 문자열 소팅
- StringSort 프로그램 
07-2 분산 캐시를 이용한 조인 - JoinIDTitle2 
07-3 역색인 만들기 - Inverted Index 버전 1 
07-4 역색인 만들기 - Inverted Index 버전 2
07-5 역색인 만들기 - Inverted Index 버전 3 
07-6 검색엔진 색인 만들기 - CreateESIndex
마무리 

셋째마당
Pig, 스트리밍, 
아마존 ElasticMapReduce 프로그래밍

08장 Pig, 스트리밍 MapReduce 프로그래밍 언어
08-1 자바 이외의 다른 프로그래밍 언어들
08-2 스트리밍 프로그래밍 
08-3 Pig 프로그래밍 
마무리 

09장 아마존 ElasticMapReduce 사용해보기 
09-1 클라우드 컴퓨팅이란? 
09-2 아마존의 AWS 소개
09-3 ElasticMapReduce 소개 
09-4 ElasticMapReduce : 위저드 
09-5 ElasticMapReduce : 루비 클라이언트
마무리 

1장~9장 마무리 
부록 - MS 윈도우에서 하둡 설치하기 


첨부파일
첨부이미지
1