클라우드 믿었다 클납니다

 



이미행복벗은 폰에 용량 넉넉히 남아 있어? 도넛몬🍩 건 맨날 꽉 차 있어. 사진, 동영상 때문이지. 서너 달에 한 번 외장하드에 옮겨놓는데, 문뜩 그런 생각이 드는 거야. 외장하드를 잃어버리면 어쩌지? 소중한 추억이 사라지잖아!

그래서 찾아본 게 구글 포토 서비스. 구글 클라우드에 사진을 보관하면 전 세계 어디서든 접속해 확인할 수 있으니 좋아 보이더라고. 근데 매달 나가는 돈을 생기는 거니까 고민중.🤔

그러다 클라우드 뉴스를 봤어. 미국 시가총액 1위 마이크로소프트(MS)의 클라우드에 오류가 생겨서 전 세계가 난리가 났더라? 금융 거래가 멈추고, 병원 수술이 미뤄지기도 했어. 

클라우드가 대체 뭐야? 미국의 한 기업의 문제로 전 세계 시스템이 셧다운되는 상황, 말이 돼? 대비할 방법은 뭐가 있을까? 한 번 제대로 알아봐야겠어!

🏖️휘클리는 8월1일과 8일 쉬어 가려 해. 재충전하고 8월15일에 맑은 머리로 돌아올게. 휴가 중에도 휘클리 인스타엔 꼭 알아야 할 뉴스가 업데이트될 거야. 팔로우 부탁해!
📂 오늘의 휘클리
  1. 한 번 알아봤: 뻥 뚫린 초연결 사회
  2. 한 번 물어봤다: 셧다운, 대응 방법은?
  3. 모르고리즘: 알고리즘 프리! 환경 뉴스픽
  4. 휘클러 say!: 독자피드백 + 이벤트 알림
19일  시커멓게 꺼져있는 미국 뉴욕 타임스퀘어의 전광판. 연합뉴스
📂뻥 뚫린 초연결 사회

전 세계 ‘사이버 셧다운’
  • 19일 MS💡의 클라우드 서비스 ’애저(Azure)’💡에 문제가 생겼어. 여파는 엄청났어. 전 세계 항공사와 방송사, 이동통신사, 금융기관과 같은 주요 기관의 시스템이 한순간에 ‘먹통’이 된 거야.
  • 미국, 호주에선 비행기가 지연·결항됐고 영국에선 방송사가 생방송을 못했어. 이탈리아의 증권거래소는 일부 업무가 중단됐고, 독일의 대학병원은 수술을 미뤘고. 24시간 번쩍이는 미국 뉴욕 맨해튼의 타임스퀘어 전광판이 꺼지기도 했어.
  • 국내 피해는 상대적으로 덜했지만, 있긴 있었어. 이스타항공, 제주항공과 같은 저비용항공사(LCC)의 예약·발권 시스템에 오류가 생겼어. 펄어비스의 ‘검은사막’, 그라비티의 ‘라그나로크 오리진’ 등 게임 사이트도 멈춰버렸지.
  • 미국 CNN은 이번 사고의 피해 비용이 10억달러(1조3880억원)를 넘길 거라고 보도했어. 역대 최악의 전산마비 사태로 기록될 듯.

MS 문제일까
  • 정확히 말하자면, MS가 아니라 크라우드스트라이크💡라는 회사 때문이야. 미국의 사이버 보안 업체인데, 한국으로 치면 안랩과 같은 곳. 포춘 500💡 기업의 절반 이상인 298곳이 고객사일 정도로 글로벌 시장에서 잘 나가는 기업이야.
  • 이 회사가 자기네 보안 소프트웨어 ’팰컨 센서’💡를 업데이트하는 과정에서 문제가 발생했고, MS 운영체제(OS) ’윈도’는 이를 심각한 시스템 오류로 인식했어. ’죽음의 블루스크린(BSOD)’💡 상태가 돼버린 거지. 왜, 윈도에 에러가 나면 파란 화면이 뜨며 멈추잖아. 그렇게 된 거야.
  • 이번 사고로 총 850만개의 윈도 기기가 영향을 받았대. 전체 윈도 기기의 1% 미만으로 비중은 적었지. 그런데 하필이면 MS가 운영하는 클라우드 서비스 ’애저(Azure)’💡에서도 오류가 난 거야.
  • 클라우드에 문제가 생기면 여기에 연결된 고객사들 시스템에 연쇄적으로 영향을 미쳐. 장점이던 연결성이 취약점이 되는 거지. 구조적으로 피해가 눈덩이처럼 불어날 수밖에 없어.

빅3가 70% 점유 
  • 클라우드란 뭘까? 온라인 기반의 가상 서버에 기업과 공공기관과 같은 이용자들이 데이터와 시스템을 보관할 수 있는 서비스야. 기업이 자체 서버를 갖추지 않아도 되니 경제적 부담이 덜 하지. 네트워크💡가 구름처럼 연결돼 있어서 그런 이름이 붙었어.
  • 미국의 빅테크💡기업들은 최근 10여년간 클라우드 사업에 주력해왔어. 올 1분기 기준 아마존웹서비스(AWS)가 31%의 시장 점유율로 1위고, MS 애저가 25%로 2위야. 구글 클라우드(GCP)는 11%로 3위. 빅테크 세 곳이 시장의 70% 가까이를 차지하고 있는 거지.
  • 클라우드 서비스 운영의 핵심은 대규모 데이터 센터💡 설치와 관리야. 여기에 막대한 비용이 들어가. 세계적 빅테크가 시장을 이끌 수밖에 없는 이유.
  • 그런데 세 회사의 클라우드 서비스에 문제가 생기면? 전 세계가 마비될 수 있어. 이번에 1%도 안 되는 MS 윈도 기기에서 오류가 났는데, 그 파장이 엄청났잖아. 
  💡  하이라이트
마이크로소프트(MS): 빌 게이츠가 창업한 미국의 빅테크 기업. 컴퓨터 운영체제 윈도로 유명
애저(Azure): MS가 제공하는 클라우드 서비스. 2010년 출시
크라우드스트라이크(CrowdStrike): 
2011년 미국 텍사스 오스틴에 설립된 사이버 보안 회사
포춘500: 미국 경제지 포춘이 매년 발표하는 매출액 기준 미국 500대 기업
팰컨 센서(Falcon sensor): 크라우드스트라이크가 판매하는 보안 소프트웨어
죽음의 블루스크린(Blue Screen Of Death): 윈도가 오류를 감지했을 때 파란 화면이 뜨는 것
네트워크: 컴퓨터 등을 이용해 서로 연결시켜 주는 체계
빅테크(Big Tech): 구글, 아마존, 메타, MS, 애플, 알파벳 등 초대형 정보기술(IT) 기업
데이터 센터: 서버, 스토리지 등 IT 서비스에 필요한 장비를 모아두고 관리하는 시설
MS가 전 세계 60개 이상의 지역에 둔 300개 이상의 데이터 센터 지도. MS
돈이 되는 클라우드
  • 그래도 기업들은 갈수록 클라우드 서비스에 더 의존하게 될 거야. 생성형 인공지능(AI)💡 산업 때문이지. 기업이 각자 전산센터를 만들어 거대한 인공지능 모델을 돌리기란 쉽지 않아. 너무 큰 돈이 드니까. 결국 빅테크가 구축해놓은 서비스를 이용하게 되는 거야.
  • MS는 아마존이나 구글에 비해 뒤늦게 클라우드 시장에 뛰어들었는데, 최근 무섭게 성장 중이었어. 애저가 독점적으로 챗GPT💡를 서비스에 탑재하고 있었거든. MS가 챗GPT를 만든 오픈AI💡에 대규모 투자를 한 대주주니까. 
  • 전 세계 60여개 지역에 MS의 데이터 센터가 300여개 있는데, MS는 더 늘리려고 하고 있어. 돈이 되거든. 지난 1분기 클라우드 서비스 매출이 작년 같은 기간보다 31%나 늘었어.

아마존이 압도적 1위
  • 다행히 국내 기업들 피해는 적었어. 크라우드스트라이크나 MS 클라우드를 상대적으로 덜 쓰고 있어서야. 한국은 아마존 클라우드를 많이 쓰고 있거든. 작년 기준 국내 기업의 클라우드 플랫폼 이용 현황을 보면, 아마존이 60.2%로 압도적 1위야. 이어 MS가 24%, 네이버 20.5%, 구글 19.9% 순.
  • 공공기관은 네이버나 KT 같은 국내 업체의 서비스를 주로 이용하고 있어. 외국 클라우드가 국내 공공기관에 서비스를 제공하려면 보안인증(CSAP)💡을 받아야 하는데 통과한 곳이 없거든. 인천공항은 자체 서버를 운영 중이고.
  • 이번엔 운이 좋았지만, 만약 아마존의 클라우드 서비스에 오류가 난다면? 생각만 해도 끔찍해. 셧다운이 한 번 발생하면 피해가 너무 크니까 서둘러 대책을 마련해야 해.
  💡  하이라이트
생성형 인공지능(AI): 학습을 통해 이용자의 의도에 맞게 새로운 콘텐츠를 생산할 수 있는 AI
오픈AI: 미국의 AI 개발사로 생성형 AI 서비스인 챗GPT 제공
챗GPT: 오픈AI가 2022년 12월 공개한 대화 전문 AI 챗봇
CSAP: 한국인터넷진흥원(KISA)이 주관하는 클라우드 서비스 보안 인증 제도
로이터 연합뉴스

🎙️️왜 이런 일이 생긴 거야? 

💬처음에는 MS 클라우드의 문제라고 봤어. 제주항공도 자기네 사이트에 알림 공고로 ’MS 클라우드 장애로 이 사태가 벌어졌다’고 썼을 정도. MS 클라우드를 쓰는 곳들에서 에러가 났으니까. 


🎙️️근데 아니다? 

💬MS가 조사해보니 자기네 클라우드가 다 뻗어버린 건 아니다, 윈도 운영체제에서 돌아가는 보안 제품 중 하나인 크라우드스트라이크가 업데이트 파일을 올린 것 중에 결함이 있어서 이렇게 됐다고 하는 거야.


🎙️️크라우드스트라이크의 문제다?

💬클라우드 서비스는 데이터 센터를 기반으로 해. 그 서버에도 운영체제가 필요하지. 그걸 윈도로 돌리는 것들이 일부 멈춘 거고. 모든 MS의 서버가 다 윈도를 운영체제로 쓰는 건 아니거든. MS가 파악해보니 1% 정도의 윈도 기기에만 영향을 미쳤다는 거야. 그러니 MS는 더더욱 이건 우리 클라우드의 문제가 아니다, 외부 보안 회사가 일으킨 문제다, 이렇게 강조하는 거지.


🎙️️클라우드의 문제는 아닌 거네.

💬그렇지. 일반 개인이 (클라우드를 안 쓰더라도) 윈도 운영 PC에서 크라우드스트라이크를 이용하고 있었으면 충돌이 났을 테니까. 그래서 처음에는 MS 클라우드발 먹통으로 표현하다가 뒤에는 크라우드스트라이크 장애라든지 IT 대란이라든지로 표현을 다르게 하고 있어.


🎙️️MS 책임도 있긴 해?

💬응. 사실 클라우드 서비스를 이용하는 대다수 기업들은 이런 분야에 전문적이지도 않고 MS가 다 알아서 해주길 바라며 맡기는 거잖아. 보안 문제도 알아서 대처해주고, 잘 돌아갈 거로 믿고 비용을 주고 맡긴 건데.


🎙️️MS도 문제네.

💬실제 MS 같은 클라우드 회사들이 고객사 대상으로 영업을 할 때는 자기네 클라우드에 맡기면 서버 공간도 아끼고 전력, 보안, 기술 인력 등 다 신경 쓸 필요가 없으니 좋다고 강조하거든. 제일 중요한 게 보안인데, 안정성이 높아 끊기지 않는다고 제일 강조해.


🎙️️근데 끊겼잖아!

💬MS는 그래서 이번 사건은 자기네 사고는 아니지만, 글로벌 클라우드 공급업체, 소프트웨어 플랫폼, 보안 공급업체 및 기타 소프트웨어 공급업체, 마지막으로 고객까지 광범위한 생태계의 상호 연결된 특성을 보여준다고 밝혔어. 연결성을 인정하지만, 문제가 터진 건 보안 회사라는 걸 명확히 했고.


🎙️️하필 자기네 클라우드 서비스 애저에 오류가 생겨서 어쩔 수 없었다?

💬그렇지. 클라우드가 (오류 대상에) 포함되면 여기에 이어진 생태계가 워낙 거대하니까. 클라우드는 각 기업의 전산센터를 대체할 정도로 의존도가 높고 AI 시대에는 더 높아지고 있잖아. 무엇보다 고객사 당사자들이 즉각 대처를 할 수도 없고 말야.


🎙️️대처?

💬예를 들면 내 PC에서 문제가 생겼으면 서버 선이라도 뺐다가 꽂아보든지 할 텐데, 클라우드는 가상을 연결해서 내 서버처럼 쓰는 거잖아. 접속이 끊기면 고객은 할 수 있는 게 아무것도 없어. 기업들은 먹통 상태로 자체 인력이 있어도 아무것도 할 수 없는 거야. 손 놓고 MS만 쳐다봐야 하는 거지.


🎙️️지금 오류는 다 복구된 거야?

💬복구라 하면, 잘못된 파일을 각각 PC나 윈도 서버에서 삭제해야 하는 것인데. 수동으로 해야 해. 19일에 발생했는데 20일에는 대부분 복구됐어. 시스템만 복구된 거지 그로 인한 피해가 복구된 건 아니고.


🎙️️피해액이 10억 달러 이상이라는데?

💬크라우드스트라이크가 아직 배상 얘기는 하고 있지 않은데. 보도 중 이런 내용이 있어. 약관에, 에러가 일어났을 경우 크라우드스트라이크에 다달이 내는 돈만 환불해주는 정도로 배상한다고. 그래서 배상 범위가 크지 않을 수 있다고.


🎙️️MS는 배상 책임이 없고? 

💬그건 더 봐야 할 텐데. 국내 사례를 보면 2022년 10월 카카오톡 먹통이 길게 발생했는데, 원인이 SK C&C가 운영하는 데이터 센터 화재였거든. 카카오톡은 사용자들에게 이모티콘을 주거나 소상공인 대책을 마련했어. 직접 나선 거지.


🎙️️MS도 여러 나라 고객사에 배상을 해야겠네?

💬제대로 보상을 받으려면 소송으로 갈 수밖에 없는데, 이번이 워낙 초유의 사태잖아. 예를 들면 병원은 수술을 못 하고, 방송사는 생방송을 못 해서 광고도 영향을 다 받았어. 미국 뉴욕 타임스퀘어도 꺼졌고. 화물 배송이 미뤄져 복구할 수 없는 피해가 발생한 곳도 있어. 이에 대한 정산과 판단이 어떻게 될지는 더 지켜봐야 할 거 같아.


🎙️️정말 보통 일이 아니구나.

💬연결성을 기반으로 한 클라우드 사업이 큰 위험성을 안고 있는 것을 이번에 정말 제대로 보여줬지.


🎙️️클라우드 사업자들도 그걸 알았을 텐데.

💬물론이지. MS와 구글 같은 클라우드 사업자들은 안정성을 높이려고 해왔어. 계속 보안 회사를 비싼 값에 사들이기도 했고. 이게 끊어지면 끝이 나버리니까. 데이터 센터 자체도 각종 위협에 대비시키기 위해 노력했고.


🎙️️데이터 센터를? 

💬예를 들면 지진이 발생할 수도 있잖아. 물리적 위협이 생기는 거지. 각 지역에 데이터 센터를 계속해서 짓고 있는데 한국에 지을 때도 서울과 부산으로 떨어뜨려서 지었거든. 한 곳에 문제가 생겨도 다른 한 곳이 움직이게 하려고. 그렇게 안정성을 굉장히 신경 써왔어.


🎙️️그래도 셧다운이 발생해?

💬그렇지. 그런데 가입자도 할 말은 많아. 너네 프로그램 위에 많은 소프트웨어가 돌아가고 그게 오류가 나서 접속이 안 되는 게 너네 책임이 아니라는 설명, 무슨 말인지는 알겠다. 하지만, 너네 그런 식으로 사업 할 거야? 그렇게 해서 클라우드 사업이 존속 가능하겠어? 이런 질문을 할 수 있는 거지. 가입자 입장에선 하나의 클라우드에 소위 ’몰빵(몰방)’하는 게 얼마나 위험한지 제대로 알게 된 거고.


🎙️️한 곳에 안 하면?

💬여러 개를 쓰는 거지. MS 한 군데에 핵심 서비스를 올려놓고 그거로만 사업을 돌리는 기업은 정말 위험해. 비용이 2배 이상 들겠지만 복수의 클라우드에 위탁해야 한다는 거지. 이에 더해서 자체 전산센터를 운영해야 하고.


🎙️️자체?

💬자기 서버를 꼭 가져야 해. 그래서 핵심 서비스의 경우 자체 서버에다가 둬야 하고. 혹시라도 어딘가에 오류가 생겨 접속이 끊겨도 직접 대응할 수 있게 해야 한다는 거지. 클라우드의 복수화와 자체 센터 보유, 이걸 동시에 해야 그나마 안전하다고 볼 수 있어.


🎙️️그러려면 너무 비싼 거 아니야?

💬맞아. 비용이 너무 많이 들어서 작은 회사들은 그렇게 하기가 쉽지 않지.

19일 항공사 시스템 먹통으로 혼란에 빠진 필리핀 마닐라 공항. 연합뉴스

🎙️큰 회사들은 그렇게 하면 되겠네?

💬사실 큰 회사들도, 최근에 생성형 AI가 대세가 되면서 자체 데이터 센터로 대응하기가 쉽지 않아졌어.


🎙️AI 때문에?

💬응. 생성형 AI는 더 많은 데이터를 더 빠르게 많이 처리하는 거잖아. 데이터 센터가 정말 더 중요해졌거든. 엔비디아 같은 비싼 반도체 칩을 잔뜩 꽂은 서버가 많이 필요해. 이런 건 돈 많은 빅테크들이나 할 수 있는 일이야. 심지어 국내 기업 중 KT조차도, MS 애저랑 같이 협력해서 사업하기로 협약을 맺었어.


🎙️KT도?

💬국내에선 데이터 센터 부자로 통하는 통신사조차, 빅테크 클라우드랑 협업을 해야 할 정도인 거야. 지금 상황이.


🎙️AI 시대엔 클라우드 의존도가 더 높아지겠네?

💬상징적인 예가 오픈AI의 챗 GPT야. 지금 챗GPT가 엄청난 용량의 데이터를 학습한 거잖아. 거대 엔진이 돌아가는 셈인데. 오픈AI도 자기네 거로 데이터를 시험해보고 싶어도 돈도 없고 컴퓨팅 파워가 부족해. 그걸 채워준 게 바로 빅테크 기업인 MS야.


🎙️️MS가 오픈AI에 투자한 걸 말하는 거야?

💬응. MS가 대규모로 투자하면서 자기 클라우드 서비스 애저와 챗GPT를 결합시켰어. 오픈AI 입장에선 좀 억울한 독점 계약이라고 볼 수 있는데. 지금 챗GPT가 100% 애저 위에서만 돌아기업용 챗GPT 구입은 애저를 구입하는 것과 같은 말이 됐어. 애저 클라우드를 사용해 데이터를 처리하니까.


🎙️️MS에게 큰 그림이 있었네.

💬그렇지. 그런 식으로 애저가 폭발적 성장을 했어. 원래 클라우드 서비스의 최강자는 아마존웹서비스였는데 지금 MS가 추격을 많이 했거든. MS가 시총 1위로 일어서게 된 결정적 이유이기도 하고.


🎙️클라우드 의존도가 높으면 더 위험해지는 거 아냐? 

💬지금 생성형 AI가 전기처럼, 기본 인프라가 될 거라고 하잖아. 모든 검색 엔진과 디지털 플랫폼도 AI를 깔겠다는 거고. 정부 플랫폼까지도. 그런데 AI의 기본 망이 자체 망이 아니라 클라우드의 망이라면 어떻게 안정성을 확보할 것인지가 큰 문제인 거지. 오류가 났을 때 대책이 없으니까.


🎙️️한국은 피해가 적었잖아.

💬MS보단 아마존 클라우드를 많이 쓰기 때문인데. 이번에 아마존이 괜찮았다고 해서 지금 구조의 사고가 아마존에서 안 난다는 보장은 없거든? 사실 크라우드스트라이크라는 보안 회사가 우리한테는 낯설어. 덜 이용하니까 그랬던 건데, 그게 우린 더 잘하고 있다, 괜찮다 단정할 수 있는 상황은 아니야.


🎙️️결국 기업들이 잘 대응해야겠네. 클라우드를 두 개 쓴다던가.

💬제대로 대응하려면 돈을 많이 써야 해. 이번에 MS가 멈추면서 회사 시스템이 멈춘 회사들을 보면 홈페이지도 먹통이 됐어. 일원화하는 건 이렇게 위험해. 그리고 이번 기회로 계약 관계를 제대로 봤으면 좋겠어.


🎙️계약 관계?

💬클라우드 서비스나 AI와 관련한 서비스 제공 기업의 약관을 보면 생각보다 더 방어적으로 써놓은 경우가 많다고 해. 굉장한 피해가 발생해도 고객사 기업들이 떠안게 되는 구조가 많다는 건데, 이런 상황들을 잘 봐야 하지 않을까.


🎙️️회사 말고 개인은? 문제가 없어?

💬생성형 AI 시대로 가면서 빅테크 기업들이 우리의 데이터를 너무나 탐내고 있어. 예를 들면 구글 닥스를 이용하면 그게 구글 클라우드로 저장된다는 얘기도 있어. 우리가 너무 편리하게 도움을 받는 무료의 서비스들이 우리 개인 정보를 가져가는 방식으로 제공되는 거야.


️️🎙️️그래? 나도 구글 클라우드를 써볼까 했는데. 

💬편리하니까 많이 이용하지. 자동 분류도 해주고 태그도 붙여주고 좋잖아. 그런데 그 처리 과정은 결국 클라우드로 돌릴 수밖에 없어. 난 애플 폰을 쓰는데 다음부터 음성비서인 시리에 챗GPT를 적용하기로 했거든. 그럼 애플 유저의 데이터가 빠져나가는 거 아니냐는 얘기가 나왔고 반발이 있었어. 이에 애플은 자체 데이터 센터에서 처리하는 거로 우려를 불식시켜보겠다고 했지만.


🎙️️삼성 폰을 써서 몰랐네.

💬삼성도 비슷해. 물론 온디바이스 AI(기기 탑재형)로 보안이 되는 부분도 있지만 (구글의 AI) 제미나이 모델로 돌리느라 구글로 가는 부분도 있어. 부지불식간에 우리 정보가 생각보다 많이 빠져나갈 수 있는 점을 염두에 둬야 해. 우리의 일상에 시스템 의존도가 높아지면 사고가 났을 때 피해를 입는 상황이 점점 더 많아진다는 점을 고민해봐야 하고.


🎙️️아무것도 안 써야 하나? 

💬그렇다고 우리가 산속에 사는 자연인이 아닌 이상 클라우드 등의 서비스를 아예 이용하지 않을 순 없는데. 이번에 목격했잖아. 다 연결돼 있고, 너무 큰 피해가 올 수 있다는 것을. 그런데 당사자는 그 순간 할 수 있는 게 아무것도 없다는 걸. 이번 사태의 교훈을 곱씹어 봐야 할 거 같아.

  🖐️  하이 파이브
  1. 보안업체 소프트웨어가 MS 클라우드에서 오류를 일으켜 IT대란이 벌어졌어.
  2. 국내는 MS 대신 아마존웹서비스를 많이 써 피해가 덜했지만 안전한 건 아냐.
  3. 생성형 AI 시대가 열리면서 기업의 클라우드 의존도는 더 높아지고 있어. 
  4. 이용하는 클라우드를 복수로 두고, 자체 서버 운영 등의 대응책이 필요해.
  5. 개인도 클라우드를 많이 쓰는데, 예상 밖의 피해에 대해 고민해볼 시점이야.


댓글 쓰기

Welcome

다음 이전