본문 바로가기

DataBase/Oracle

실행계획 SQL 연산(HASH JOIN)

실행계획 SQL 연산(HASH JOIN)

Hash Join은 테이블의 조인 시 특정 테이블 하나(크기가 작은 테이블)를 메모리로 로드 후 Hash 기법을 이용하여 조건에 맞는 데이터를 추출하는 로우(ROW) 연산 또는 집합(SET) 연산 입니다.

일반적으로 Hash Join이 Merge Join 보다 성능이 우수하므로 힌트(USE_HASH)를 이용하여 인위적으로 해시 조인이 일어나도록 하는 것이 유리 합니다.

SQL문 사용시 인위적으로 Hash Join이 일어나게 하기 위해서는 USE_HASH 라는 힌트를 사용하면 되는데 힌트를 사용하지 않더라도 Join시 두 테이블 중 한 테이블이 상당히 작아 메모리에 로드 될만한 공간이 있다면 Hsah Join이 일어나는 실행 계획을 만들어 낼 수 있습니다.

SQL> SELECT /*+ ORDERED USE_HASH(DEPT, EMP) */
               EMP.ENAME,
               EMP.SAL,
               DEPT.DNAME
      FROM   DEPT, EMP
      WHERE DEPT.DEPTNO = EMP.DEPTNO;

Execution Plan
-----------------------------------------------------------
0         SELECT STATEMENT Optimizer=CHOOSE(Cost=5 Card=80 Bytes=8888)
1        0  HASH JOIN(Cost=5 Card=80 Bytes=8888)
2        1     TABLE ACCESS (FULL) OF ‘DEPT’ (Cost=1 Card=67 Bytes=3456)
3        1     TABLE ACCESS (FULL) OF ‘EMP’  (Cost=1 Card=90 Bytes=8756)


위 실행계획에서 DEPT 테이블이 위쪽에 위치하는데 보통 작은 테이블이 위에 위치할 때 좋은 성능을 낼 수 있습니다. 즉 DEPT 테이블이 메모리에 로드 되면 Oracle은 해싱 함수를 이용하여 EMP 테이블의 ROW들을 메모리에 로드 되어 있는 값과 비교하여 원하는 데이터를 추출 하며 이때 FROM절 뒤의 테이블 순서와 USE_HASH 힌트에 나오는 테이블의 순서는 같아야 합니다.

일반적으로 USE_HASH 힌트는 ORDERED 힌트와 같이 사용되는데 이때는 USE_HASH 인수로 두번째 테이블명(Alias 명)만을 적어도 됩니다. 즉 아래처럼 말입니다.

/*+ ORDERED USE_HASH(DEPT) */

Hash Join의 성능에 영향을 주는 파라미터는 HASH_AREA_SIZE와 HAHS_MULTIBLOCK_IO_COUNT가 있으며 첫번째 파라미터는 해시 조인 시 해시 테이블을 생성하기 위해 사용 가능한 메모리의 사이즈 이며 두번째 파라미터는 한번의 I/O로 해시 조인 시 쓰거나 읽을 수 있는 블록의 수입니다.(9i 이상에서는 HASH_MULTIBLOCK_IO_COUNT 파라미터는 더 이상 사용되지 않습니다.) 

 

'DataBase > Oracle' 카테고리의 다른 글

실행계획 SQL 연산(COUNT STOPKEY)  (0) 2008.04.28
실행계획 SQL 연산(FILTER)  (0) 2008.04.28
2G 넘는 파일의 export/import(Unix)  (0) 2008.04.28
Oracle Export / Import..  (0) 2008.04.28
import , export  (0) 2008.04.28