세계 최대 클라우드 사업자 중 하나인 마이크로소프트(Microsoft)의 Azure와 Microsoft 365에서 29일(현지시간) 대규모 장애가 발생해 항공·통신·공항 등 여러 산업 현장에서 업무가 중단됐다. 장애를 모니터링하는 사이트 다운디텍터(Downdetector)에 따르면 오류 신고 건수는 정점을 찍은 뒤 감소세로 돌아서며 복구 국면에 접어들었다.
2025년 10월 29일, 인베스팅닷컴 보도에 따르면 이번 장애는 미 동부시간(ET) 12시 무렵 시작됐다. 이후 약 한 시간 만에 1Azure 이용 고객사뿐 아니라 Microsoft 자체 서비스까지 영향을 받으며 글로벌 업무 시스템이 동시다발적으로 멈췄다.
알래스카항공(Alaska Airlines)은 자사 웹사이트 등 핵심 시스템이 마이크로소프트 인프라 장애로 ‘접속 불가’ 상태에 빠졌다고 밝혔다. 영국 통신사 보더폰(Vodafone UK)과 런던 히스로 공항(Heathrow Airport) 역시 고객 응대 및 예약 시스템 전반이 지연되거나 오류를 일으키는 등 직접적인 파급효과를 확인했다.
지난주 AWS 장애 이어진 악재…인터넷 의존성 부각
불과 일주일 전에는 아마존(Amazon) AWS가 비슷한 대규모 문제를 겪었다. 당시 스냅챗(Snapchat)·레디트(Reddit) 등 인기 앱 수천 개가 동시 영향을 받으며 ‘디지털 대혼란’을 초래했다. 전문가들은 이번 사태가 ‘인터넷 기반 서비스의 상호 의존성’을 다시 한번 드러냈다고 분석한다.
Microsoft 365 측은 상태 페이지에서 “최근 적용된 구성 변경(Configuration Change)이 일부 Azure 인프라에 예기치 않은 오류를 유발했다”고 설명했다. 즉각 롤백(원상 복구) 조치를 진행했으며, 연쇄적 ‘다운스트림 영향’을 주시 중이라고 덧붙였다.
Azure는 상태 페이지에서 “전 세계 콘텐츠·애플리케이션 전송망 Azure Front Door를 활용하는 고객 및 내부 서비스가 타임아웃·에러를 경험했다”고 밝혔다.
A Front Door는 사용자가 접속한 지역과 무관하게 가장 가까운 엣지 서버로 트래픽을 분산해 응답 속도를 높여 주는 CDN(콘텐츠 전송 네트워크) 서비스다. 이번처럼 네트워크 레이어에서 오류가 발생하면, 상단 애플리케이션이 일제히 작동을 멈추는 특징이 있다.
Azure는 또 “관리 포털(Management Portal) 접근이 어려웠다”면서 “긴급 우회책을 적용해 대시보드 직접 접속은 가능하도록 했다”고 설명했다. 다만 “Marketplace 등 일부 확장 포털은 여전히 로딩 문제가 발생할 수 있다”고 경고했다.
다운디텍터 집계에 따르면 Azure 오류 신고는 피크 시점 18,000건을 넘겼지만, 13:27(ET)에는 3,299건으로 떨어졌다. Microsoft 365 신고도 같은 시각 11,700건에서 3,858건으로 감소했다. 해당 사이트는 소셜 플랫폼·통신사·정부기관 등 다양한 출처의 실시간 상태 보고를 취합해 집계한다.
Azure Portal 접근성 부분 복구
Azure는 추가 공지에서 “대다수 고객이 포털 직접 접속을 통해 서비스를 이용할 수 있을 것”이라고 밝혔다. 단, 소수 엔드포인트(endpoint)에서 여전히 로딩 오류가 보고되고 있으며, 완전 정상화까지 시간차가 있을 수 있다고 강조했다.
한편, 지난주 AWS 장애는 지난해 보안업체 CrowdStrike의 업데이트 오류로 전 세계 병원·은행·공항 시스템이 마비됐던 사건 이후 가장 큰 규모의 인터넷 중단 사태로 기록됐다. 전문가들은 “퍼블릭 클라우드 집중 의존 구조가 불가피한 위험을 노출하고 있다”고 평가한다.
1미 동부시간(ET)은 한국시간(KST)보다 13시간 늦다.















