System Architecture · 한장정리
[기술사토픽] BCP·업무연속성 & DR 운영 완벽 정리 - 한장정리
BCP(업무연속성)에서 DR(재해복구) 목표(RTO/RPO)를 도출하고, 복구 절차·훈련으로 실제 가동까지 연결하는 핵심을 압축합니다.
Ⅰ. BCP가 만드는 목표
BCP(Business Continuity Plan)는 “장애가 나도 핵심 업무를 끊지 않는다”는 의사결정 체계입니다. 출발점은 BIA(업무영향분석)로, 서비스 중단이 비즈니스에 미치는 영향과 허용 가능한 복구 시간을 정의합니다.
| 구성요소 | 산출물 | 의미 |
|---|---|---|
| BIA | 복구 우선순위 | 업무별 허용 중단시간 |
| 복구 목표 | RTO / RPO | 시간 목표·데이터 손실 목표 |
| 전략 | DR 아키텍처 | 콜드/웜/핫, 복제 방식 선택 |
| 운영 | Runbook / 훈련 | 사람이 실제로 복구를 수행 |
Ⅱ. DR(재해복구) 설계
구성도
예방 통제
위험 식별·BIA
재해 발생 사전 방지
재해 발생 사전 방지
감지 통제
모니터링·경보
재해 조기 감지
재해 조기 감지
↓ 재해 발생
대응 통제 (BCP 발동)
비상 대응 계획 실행
위기 커뮤니케이션·업무 연속성 확보
위기 커뮤니케이션·업무 연속성 확보
↓ 시스템 복구
복구 통제 (DR)
RTO·RPO 목표 달성
Hot/Warm/Cold 사이트 전환
Hot/Warm/Cold 사이트 전환
↓ 사후 검증
테스트·검증
DR 훈련·BCP 점검
교훈 반영 및 계획 개선
교훈 반영 및 계획 개선
가. RTO·RPO
RTO는 복구 시간 목표, RPO는 허용 가능한 데이터 손실 시점입니다. 시험에서는 숫자 산정(가정과 근거)이 자주 묻습니다.
| 전략 | 복구 속도(RTO) | 데이터 최신성(RPO) | 비용 |
|---|---|---|---|
| 콜드 사이트 | 느림(수일~수주) | 최신성 낮음 | 낮음 |
| 웜 사이트 | 중간(수시간~수일) | 중간 최신성 | 중간 |
| 핫 사이트 | 거의 즉시 | 거의 0 손실 | 높음 |
나. 백업·복제와 복구 절차
DR은 “백업 파일이 있다”로 끝나지 않습니다. 복구는 절차(Playbook) + 검증(테스트) + 자동화(가능 범위)로 완성됩니다. 특히 데이터 일관성(Consistency)과 의존성(데이터베이스/메시지/인프라)을 함께 설계해야 합니다.
Ⅲ. 훈련·검증으로 “가동” 만들기
시험 포인트
DR 테스트는 실제 장애 복구처럼 수행해야 가치가 있습니다. 최소한 테이블탑(사전 점검) → 부분 복구 → 전체 복구 단계로 성숙도를 높이는 서술이 유리합니다.
결론
BCP·DR은 문서가 아니라 복구 능력 그 자체입니다.
BIA로 목표를 정하고, DR 전략으로 설계한 뒤, 반복 훈련으로 복구 시간이 현실에서 확보되도록 관리해야 합니다.
"연속성은 계획이 아니라 검증된 실행으로 보장된다."
블로그: 기술사 학습노트 · imt-log.tistory.com
'시스템아키텍처' 카테고리의 다른 글
| 이해관계자의 다중 관점을 통합하는 설계 나침반: 소프트웨어 아키텍처 4+1 뷰 모델 (0) | 2026.04.13 |
|---|---|
| CORS 동작 원리와 Preflight 요청·보안 정책 완전 정리 (1) | 2026.04.13 |
| PCB(Process Control Block) 8가지 구성요소 정리 (0) | 2026.04.10 |
| 아키텍처 뷰(View)와 관심사 분리: ISO 42010 메타 모델과 12207 테일러링 전략 (0) | 2026.04.06 |
| ISO/IEC 15504(SPICE) 프로세스 평가모델과 성숙도 체계 정리 (1) | 2026.04.04 |