Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 백준 사이트
- 자바 디자인 패턴
- http 완벽가이드
- String 함수
- MongoDB Realm
- 정렬
- http 개념
- 고 배열
- 도메인 주도 개발 시작하기
- 트리 순회
- ddd
- golang
- 백준 12761
- 파이썬
- 자바 디자인패턴
- 백준 파이썬
- 몽고디비 렘
- 백준
- 12761 돌다리
- domain driven develop
- 12761번 돌다리
- flask
- go
- 도메인 주도 개발
- golang struct
- hadoop
- 자바
- 백준 12761번
- 우분투
- 하둡
Archives
- Today
- Total
목록맵과리듀스 (1)
개발바닥
MapReduce 프로그램은 기본적으로 맵과 리듀스의 두 단계로 구성이 되고 맵과 리듀스 모두 입력으로 주어지는 데이터나 출력으로 내보내는 데이터가 모두 (key,value) 형태로 구성됩니다. 맵(Map) 의 기본 동작에 대해서 알아 보겠습니다. 일반적으로 데이터가 주어졌을 때 데이터를 라인별로 나누게 됩니다. 입력 레코드에 k1은 라인 번호이고 v1은 문장입니다. 맵에서 데이터를 가공해서 같은 키값을 갖는 레코드들을 모아서 리듀스로 하나의 입력으로 들어가게 됩니다. 리듀스 입력 레코드의 키는 맵의 출력 레코드의 키가 됩니다. 같은 키를 갖는 맵의 출력 레코드들의 밸류를 리스트로 만든 것이 리듀스 입력 레코드의 밸류가 됩니다. 리듀스는 맵의 처리결과를 보고 같은 키값을 갖는 것들에 대해 또 다른 작업을..
Hadoop
2018. 10. 6. 18:06