아마존웹서비스(AWS)가 도메인네임시스템(DNS ) 오류로 시작된 대규모 장애를 약 6시간 만에 수습했지만, 전 세계 수천 개 서비스가 동시 마비되면서 클라우드 인프라 취약성이 다시 한번 드러났다.
한국에서도 △삼성월렛 △PUBG:배틀그라운드 △로블록스 △퍼블렉시티 △캔바 △포트나이트 △클래시로얄 등 주요 IT·결제·게임 시스템이 마비됐다.
특히 한국 대기업과 외국계 기업들이 많이 사용하는 사내 메신저 ‘슬랙 ‘(세일즈포스)이 ‘먹통’되면서 업무 차질을 빚었다.
20일(현지시간) 미국 북부 버지니아에 있는 AWS 최대 리전 US-EAST-1에서 한국시간 오후 4시쯤(태평양 시간 오전 12시)부터 다수의 오류가 발생했다.
AWS는 상태페이지를 통해 이날 오후 5시 26분(오전 1시 26분) DynamoDB(고성능 데이터베이스 서비스)의 엔드포인트 요청에서 심각한 오류율이 확인됐고 다른 AWS 서비스들에도 영향을 미치고 있다고 설명했다.
조사 결과 DynamoDB 애플리케이션프로그래밍인터페이스(API) 엔드포인트가 DNS를 해석하는 과정에서 문제가 발생했다. AWS 핵심 리전에 발생한 오류는 한국시간 21일 오전 7시쯤 완전 정상화됐다.
IT 장애 추척(모니터링) 사이트 다운디텍터에 따르면 전 세계적으로 650만 건 이상의 장애 신고가 접수됐고 1000개 이상 기업이 영향을 받았다. 스트리밍 서비스인 디즈니플러스·훌루·프라임 비디오도 일부 차질을 빚었다.

한국에서도 삼성월렛·배틀그라운드·퍼플렉시티·로블록스·슬랙 등이 마비됐다.
삼성전자·SK그룹·LG유플러스·LG CNS·카카오·네이버웹툰·우아한형제들(배달의민족) 등 사내 메신저로 슬랙을 활용 중인 기업들은 업무 차질이 발생했다.
인기게임 로블록스 장애로 이 게임을 즐기는 한국의 어린이·청소년들도 불편을 겪었다.
현재 서비스들은 대부분 정상화됐다. SK텔레콤·삼성전자·현대차·넥슨 등도 AWS 인프라를 활용하고 있어 대규모 장애 발생 시 국내 산업 전반에 충격을 줄 수 있다는 지적이 나온다.
현대차는 AWS 클라우드를 제조·공급망·커넥티드카 개발 등에 활용하고 있다. SK텔레콤은 AWS와 장기간 파트너십을 맺고 울산에 AI 데이터센터를 구축하고 있다.
전문가들은 특정 클라우드 기업 의존도를 낮춰야 한다고 조언한다.
업계 관계자는 “AWS는 글로벌 클라우드 시장 점유율 30%를 차지하는 핵심 사업자”라며 “특히 US-EAST-1은 AWS의 가장 오래된 핵심 리전으로 수많은 글로벌 서비스의 핵심 허브 역할을 하고 있어 이번 장애에 따른 파급효과가 컸던 것으로 분석된다”고 말했다.
슬랙(Slack)은 기업 사내 커뮤니케이션과 협업을 효율적으로 관리하기 위한 업무용 메신저 기반 협업 플랫폼이다. 2013년 미국 슬랙 테크놀로지스(Slack Technologies)가 개발했다. 현재는 세일즈포스(Salesforce)가 슬랙을 인수해 전 세계 수백만 명이 사용하는 대표적인 협업 툴로 자리잡았다.
리전(Region)은 클라우드 서비스 제공업체가 전 세계 여러 지역에 설치한 데이터센터들의 집합을 의미한다. 하나의 리전은 일반적으로 2개 이상의 데이터센터(가용 영역·Availability Zone)로 구성돼 있다. 데이터센터들은 서로 물리적으로 분리돼 있어 장애 발생 시 서비스의 연속성과 안정성을 보장한다.
DNS(Domain Name System·도메인 네임 시스템)는 인터넷의 주소록 역할을 하는 핵심 인프라다. 이용자가 기억하기 쉬운 문자 형태의 도메인을 입력하면 DNS는 이를 컴퓨터가 이해할 수 있는 숫자 형태의 IP 주소로 변환한다.