DB/MySQL

[MySQL] MySQL 아키텍처

Joonfluence 2024. 1. 30. 12:49

MySQL 아키텍처

출처 : https://dev.mysql.com/doc/refman/8.3/en/pluggable-storage-overview.html

구성

  • MySQL 접속 클라이언트
    • 역할
      • 대부분의 프로그래밍 언어에 대한 접속 클라이언트 제공
      • Shell을 통해서도 접속 가능함
  • MySQL Engine (MySQL의 두뇌)
    • 구성
      • 옵티마이저
        • 요청된 SQL 문을 최적화해서 실행시키기 위해, 실행 계획을 짜는 역할을 함.
      • 쿼리 파서
      • 전처리기
      • 실행 엔진
    • 역할
      • 클라이언트 접속과 SQL 요청을 처리함.
  • MySQL 스토리지 엔진 (MySQL의 손발)
    • 역할
      • 데이터를 실제로 디스크에 저장하거나 디스크에 저장된 데이터를 불러오는 역할
      • 옵티마이저가 작성한 실행 계획에 따라서 스토리지 엔진을 적절히 호출해서 쿼리를 실행
      • MySQL 엔진이 스토리지를 호출할 때, 사용하는 API를 핸들러 API라고 함
        • 직접 구현하여 추가 가능
  • 운영체제 파일시스템, 하드웨어

쿼리 실행 과정

  1. 쿼리 캐시에서 실행하고자 하는 쿼리 결과가 존재하는지 확인한다. 있으면 바로 반환하고 없으면 쿼리 파서에 전달한다.
  2. 쿼리 파서에서 쿼리 문장을 토큰으로 분리해 트리 형태의 구조로 변환한다.
  3. 전처리기에서 Parse tree를 기반으로 SQL의 문장 구조를 체크합니다.
  4. 옵티마이저에서 SQL 실행을 최적화해서 실행 계획을 수립합니다.
  5. 실행 엔진에서 옵티마이저가 만든 실행 계획에 따라, 스토리지 엔진을 호출합니다.
  6. 스토리지 엔진에서 MySQL 실행 엔진의 요청에 따라 데이터를 디스크로 저장하고 디스크로부터 읽어오는 역할을 담당합니다.

쿼리 캐시

  • 역할
    • SQL 실행 결과를 메모리에 캐싱하는 역할
    • 동일 SQL 실행 시 이전 결과 즉시 반환
    • 테이블의 데이터가 변경되면 캐싱된 데이터 삭제 필요 (쿼리 캐시에 접근하는 쓰레드에 Lock이 걸리며, 동시 처리 성능 저하 유발)
  • 특징
    • MySQL 8.0 부터 완전히 제거됨

쿼리 파서

  • 역할
    • SQL 문장을 토큰으로 쪼개서 트리로 만듦
    • 이 과정에서 쿼리 문장의 기본 문법 오류를 체크

전처리기 (Preprocessor)

  • 역할
    • Parse tree를 기반으로 SQL의 문장 구조를 체크함. 
      • Parse tree의 토큰이 유효한지 체크함. 

옵티마이저 (Query Optimizer)

  • 역할
    • SQL 실행을 최적화해서 실행 계획을 수립함
  • 두 가지 방법으로 최적화함
    • 규칙 기반 최적화
      • 옵티마이저에 내장된 우선순위에 따라 실행 계획 수립
    • 비용 기반 최적화
      • 작업의 비용과 대상 테이블의 통계 정보를 활용해서 실행 계획 수립
      • MySQL을 포함한 대부분의 DBMS에서 이 비용 기반 최적화 방식을 사용

쿼리 실행 엔진 (Query Execution Engine)

  • 역할
    • 옵티마이저가 만든 실행 계획대로 스토리지 엔진을 호출해서 레코드를 읽고 씀. 

스토리지 엔진

  • 역할
    • 쿼리 실행 엔진이 요청하는대로 데이터를 디스크로 저장하고 읽음
  • 특징
    • 핸들러 API에 의해 동작함
    • 핸들러라고도 불림
    • 플러그인 형태(인증 등)로 제공됨

InnoDB 스토리지 엔진 아키텍처

출처 : https://dev.mysql.com/doc/refman/8.3/en/innodb-architecture.html

  • 특징
    • 프라이머리 키에 의한 클러스터링
    • 트랜잭션 지원 (MVCC, 리두 로그 & 언두 로그, 레코드 단위 잠금)
    • 데이터 캐싱 (InnoDB 버퍼풀 사용)
    • 어댑티브 해시 인덱스
    • 외래키 설정 지원 O
    • 클러스터링 테이블 O
    • 레코드 단위 잠금 (인덱스 레코드에 대한 잠금)

PK에 의한 클러스터링

  • 특징
    • 레코드를 PK순으로 정렬해서 저장.
    • PK 인덱스 자동 생성.
    • PK를 통해서만 레코드에 접근 가능.
    • PK를 통한 범위 검색이 매우 빠름.
      • PK 기준으로 데이터가 정렬되어 묶여서 한 군데 저장되어 있기 때문.
    • But 클러스터링 때문에 쓰기 성능 저하
      • PK 값이 바뀌면 그에 따라 레코드의 물리적 순서도 하나씩 바꿔줘야 하기 때문.
      • 웹 서비스의 경우, 쓰기 성능을 희생하고 읽기 성능을 얻는 클러스터링을 하는 것이 합리적임.
      • 참고로 InnoDB에서 PK를 지정하지 않으면, 내부적으로 PK를 자동 생성해서 클러스터링한다. 이렇게 내부적으로 생성된 PK는 사용자가 직접 사용할 수 없다. 따라서 InnoDB에서 테이블을 설계할 때는 PK를 직접 설정하는 것이 좋다. 

트랜잭션

MVCC(Multi Version Concurrency Control)

  • 위 다이어그램은 데이터베이스의 상태를 나타냄
    • InnoDB 버퍼풀은 변경된 데이터를 디스크에 반영하기 전(즉, commit 전)까지 버퍼링하는 공간
    • 언두 로그는 변경 시점에 변경되기 이전 데이터를 백업 해두는 공간

  • MVCC(Multi Version Concurrency Control)
    • 트랜잭션 격리 수준에 따라, 조회 결과가 달라지게 하는 기술
    • 이 때 결괏값은 어떻게 될까?
      • 트랜잭션 격리 수준이 READ_UNCOMMITED라면 InnoDB 버퍼풀에 저장된 “코딩”을 조회한다.
      • READ_COMMITED, REPETABLE_READ, SERIALAZABLE 이라면 언두 로그에 저장된 “독서”를 조회한다.

 

 

언두 로그와 리두로그

  • 언두로그
    • 변경되기 이전 데이터를 백업
    • 트랜잭션 보장
    • 트랜잭션 격리 수준 보장
  • 리두로그
    • 변경된 데이터를 백업 (Commit 완료된 데이터)
    • 영속성 보장 (서버 비정상 종료시, 리두 로그에 백업된 데이터 복원)

레코드 단위 잠금

  • 특징
    • 레코드 단위로 잠금을 걸면 동시 처리 성능을 향상시킬 수 있다
    • 레코드 자체를 잠그는 것이 아니라, 사실 인덱스 기준으로 잠그는 것
  • 예시
    • User 테이블의 총 레코드 개수는 5000개
    • 성씨 칼럼이 '박'인 레코드는 300개 존재
    • 성씨 칼럼이 '박'이고 이름 칼럼이 '병욱'인 레코드는 1개 존재
    • 성씨 칼럼에는 idx_성씨 인덱스가 걸려있음
  • 예시 설명
    • 업데이트 상황에서 먼저 박병욱 레코드를 검색한다.
    • 성씨 인덱스 칼럼을 사용한다.
    • innoDB는 레코드 자체를 잠그지 않고 인덱스 레코드를 잠그는 방식으로 동작하여, 업데이트 레코드 검색에 사용된 인덱스 레코드를 잠근다.

버퍼풀

  • 용도
    • 데이터 캐싱
      • 인덱스 정보와 데이터 파일을 메모리에 캐싱
      • 페이지 단위로 테이블 데이터를 관리
      • 페이지 교체 알고리즘으로 LRU 사용
    • 쓰기 지연 버퍼
      • 변경된 데이터를 버퍼풀에 모았다가, 한 번에 디스크에 기록함
      • JPA 영속 컨텍스트의 쓰기 지연 SQL 저장소와 비슷함
  • 어댑티브 해시 인덱스
    • 페이지에 빠르게 접근하기 위한 해시 자료구조 기반 인덱스
    • <인덱스 키, 페이지 주소 값> 쌍으로 구성됨
    • 자주 요청되는 페이지에 대해 InnoDB가 자동으로 생성하는 인덱스

MyISAM 스토리지 엔진 아키텍처

  • 특징
    • 클러스터링 지원 X
    • 트랜잭션 지원 X
    • 외래키 지원 X
    • 테이블 단위 잠금
    • 키 캐시 사용(인덱스 정보만 버퍼링)
    • 전문 검색, 공간 좌표 검색 기능 지원

레퍼런스

반응형