마이크로소프트(Microsoft)의 핵심 클라우드 서비스인 Azure와 생산성 소프트웨어 모음 Microsoft 365에서 29일(현지시간) 대규모 장애가 발생했다. 이번 장애는 실시간 장애 추적 사이트 다운디텍터(Downdetector)에 접수된 신고를 기준으로 Azure는 1만 7,000건 이상, Microsoft 365는 약 1만 1,500건에 달하는 이용 불편 사례를 낳았다.
2025년 10월 29일, 인베스팅닷컴의 보도에 따르면 마이크로소프트는 자사 Azure 상태 페이지를 통해 “포털 접근 문제를 조사 중”이라고 밝혔다. 이어 “Microsoft 365 관리 센터 접속 불가 및 Outlook 애드인‧네트워크 지연” 등 추가 문제도 동시에 보고됐다.
마이크로소프트는 “현재 Azure 포털에 접근하지 못하는 고객이 있다”면서 “원인 규명과 복구 작업을 병행하고 있다”고 설명했다.
회사 측은 Microsoft 365 관련 서비스 역시 영향권에 있음을 인정하며, 관리자 센터 접속 지연·불가와 Outlook 애드인 오류 등을 언급했다.
Downdetector 집계에 따르면 동일 시점 미국 내 아마존(Amazon) AWS 클라우드 서비스도 장애가 보고됐다. 다만 AWS 측 장애 범위와 원인, 복구 진행 상황은 이번 기사 작성 시점 기준으로 별도 공지되지 않았다.
클라우드·협업 플랫폼 의존도 높아진 기업의 ‘리스크 관리’
Azure와 Microsoft 365는 기업이 내부 인프라를 클라우드로 이전하거나 원격 업무 환경을 구축할 때 핵심적으로 사용하는 플랫폼이다. 특히 Azure는 가상 서버·데이터베이스·인공지능(AI) 서비스를 묶은 종합 클라우드이며, Microsoft 365는 Word, Excel, Teams와 같은 생산성 앱을 구독 형태로 제공한다. *1 오늘처럼 두 시스템이 동시에 불안정해지면 기업 업무가 전면 중단되는 ‘단일 장애점(Single Point of Failure)’ 문제가 부각된다.
기업 IT 부서는 통상 다중 클라우드 전략이나 이중화(리던던시)를 통해 위험을 분산한다. 그러나 실제로는 비용·운영 복잡성 탓에 하나의 플랫폼에 집중하는 경우가 많다. 전문가들은 “이번 케이스는 클라우드 사업자 간 서비스 연동 및 백업 체계, 그리고 실시간 가용성 모니터링의 중요성을 재확인시키는 계기”라고 지적한다.
알아두면 좋은 용어
Azure란? 마이크로소프트가 운영하는 퍼블릭 클라우드 플랫폼으로, 서버·스토리지·네트워킹·AI 등 200여 개 서비스를 제공한다.
Microsoft 365란? Windows·Office·Teams 등 생산성 도구를 구독형으로 묶은 서비스.
Downdetector란? 사용자 신고와 통신사·플랫폼 상태 데이터를 분석해 실시간 장애 여부를 시각화하는 민간 사이트.
AWS(Amazon Web Services)란? 아마존이 운영하는 세계 최대 퍼블릭 클라우드 서비스.*2
이번 장애는 정전·DNS 오류·네트워크 경로 문제·소프트웨어 업데이트 결함 등 표면적 원인이 다양할 수 있으나, 마이크로소프트는 현재 “포털 접근 문제” 이상은 공개하지 않았다. 회사 관계자는 “조사 결과가 나오는 대로 세부 사항과 재발 방지책을 투명하게 공유하겠다”고 덧붙였다.
전문가 통찰
필자는 이번 사건이 ‘플랫폼 집중 리스크’를 보여주는 전형적 사례라 판단한다. 전 세계 기업 대부분이 엔드포인트 보안·문서 협업·고객 데이터 분석을 클라우드에 의존하는 현 상황에서, 단 몇 시간의 다운타임이 매출 손실·규제 위반·고객 신뢰 저하로 직결될 수 있다. 특히 SaaS 기반 업무 환경은 장애 시 우회로가 부족해 피해 체감도가 크다. 기업들은 이번 사태를 계기로 서비스 수준 계약(SLA) 재검토, 멀티 리전 배포 전략, 온·오프라인 백업 시나리오 등 다층적 대응 체계를 구축해야 한다.
더불어 마이크로소프트·아마존·구글과 같이 전 세계 트래픽을 담당하는 ‘하이퍼스케일러’들이 연쇄적으로 장애를 겪으면, 시장 전반의 주가 변동성과 공급망 리스크가 확대될 수 있다. 이번 사건은 투자자·정책 당국·규제 기관이 디지털 인프라의 복원력(Resilience)을 주요 거버넌스 과제로 삼아야 함을 시사한다.
현재(29일 16시 50분 기준) 마이크로소프트는 “일부 서비스가 점진적으로 복구 중”이라고 밝혔다. 그렇지만 이용자 체감 정상화까진 시간이 소요될 것으로 보인다. 회사는 향후 루트코즈(근본 원인) 분석 결과와 사후 대책을 공개할 예정이다.















