Skip to content

Commit 079bfc4

Browse files
committed
pj
1 parent 5cf0171 commit 079bfc4

File tree

1 file changed

+3
-3
lines changed

1 file changed

+3
-3
lines changed

_posts/2024-11-27-join_algorithms.md

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -87,9 +87,9 @@ end
8787

8888
## Parallel Sort-Merge Join
8989
1. range partitioning - sort
90-
- S, R을 조인 키의 범위로 파티셔닝한다. 동일한 키를 가진 레코드는 한 노드로 모인다.
91-
- data skew가 발생할 수 있다. 이는 샘플링을 통해 해결할 수 있다.
92-
- shuffle 발생
90+
- S, R을 조인 키의 범위로 파티셔닝한다. 동일한 키를 가진 레코드는 한 노드로 모인다. - shuffle 발생
91+
- data skew가 발생할 수 있다. 이는 샘플링을 통해 해결할 수 있다.
92+
9393
2. merge
9494
- 로컬에서 수행된다. - 병렬처리 가능.
9595
- spark 나 MapReduce에서는 input이 정렬되어있는(1번 단계가 완료된) 경우가 많아서 주로 사용한다.

0 commit comments

Comments
 (0)