AWS Aus­fall 2025: War­um Ver­trau­en in Hypers­ca­ler kei­ne Selbst­ver­ständ­lich­keit ist

Der Mor­gen, an dem Ale­xa schwieg.

Am Mon­tag­mor­gen des 20. Okto­ber 2025 wur­de das Inter­net für Mil­lio­nen von Nut­zern kurz­zei­tig klei­ner. Ama­zon Web Ser­vices, kurz AWS, mel­de­te ab 9:30 Uhr mit­tel­eu­ro­päi­scher Zeit mas­si­ve Stö­run­gen in der Regi­on us-eas­t‑1. Zahl­rei­che Platt­for­men, von Snap­chat über Asa­na bis hin zu Can­va, waren über Stun­den hin­weg nur ein­ge­schränkt oder gar nicht erreich­bar. Selbst Ama­zons eige­ne Diens­te wie Ale­xa oder Prime Video reagier­ten nicht.

Was zunächst wie eine Rand­no­tiz für Tech­nik-Por­ta­le wirk­te, ent­pupp­te sich bin­nen Minu­ten als glo­ba­ler Domi­no­ef­fekt. Denn wer heu­te im Inter­net arbei­tet, arbei­tet fast zwangs­läu­fig auf Infra­struk­tur, die aus Rechen­zen­tren weni­ger Anbie­ter gespeist wird. Der Aus­fall einer Regi­on genüg­te, um die Ver­wund­bar­keit die­ser hoch­zen­tra­li­sier­ten Archi­tek­tur sicht­bar zu machen.

Wäh­rend die Stö­rung inzwi­schen beho­ben ist, bleibt die Fra­ge: Wie viel Ver­trau­en dür­fen Unter­neh­men eigent­lich in Struk­tu­ren set­zen, die sie selbst kaum mehr über­bli­cken – und die im Zwei­fel tau­sen­de Kilo­me­ter ent­fernt ver­wal­tet wer­den?

Was am 20. Okto­ber 2025 wirk­lich geschah

Nach Anga­ben von Ama­zon Web Ser­vices begann die Stö­rung in der Regi­on US-EAST‑1 gegen 03:30 UTC. Zahl­rei­che Diens­te mel­de­ten „increased error rates“ – eine tech­ni­sche Umschrei­bung für: nichts ging mehr. Betrof­fen waren unter ande­rem die Daten­bank­platt­form Ama­zon Dyna­mo­DB sowie zen­tra­le Kom­po­nen­ten des Domain Name Sys­tem (DNS), über das Ser­ver­na­men in IP-Adres­sen über­setzt wer­den.

In der Fol­ge konn­ten Anwen­dun­gen, die in die­ser Regi­on betrie­ben oder über sie adres­siert wur­den, kei­ne Ver­bin­dung mehr zu ihren Backend-Sys­te­men her­stel­len. Das betraf nicht nur AWS-eige­ne Ange­bo­te, son­dern auch Hun­der­te popu­lä­re SaaS-Diens­te – von Slack über Zoom bis Coin­ba­se. Die Aus­wir­kun­gen reich­ten bis in Berei­che, die mit AWS auf den ers­ten Blick wenig zu tun haben: Zah­lungs­diens­te, Bil­dungs­platt­for­men, Strea­ming-Anbie­ter.

AWS Ausfall 2025: Das AWS-Rechenzentrum "AWS US EAST 1" in Ashton, USA

Laut Reu­ters dau­er­te es rund sechs Stun­den, bis alle Sys­te­me wie­der­her­ge­stellt waren. Offi­zi­ell sprach AWS spä­ter von einem „DNS reso­lu­ti­on issue“, aus­ge­löst durch eine Fehl­kon­fi­gu­ra­ti­on in der Netz­werk-Kom­mu­ni­ka­ti­on von Dyna­mo­DB-End­punk­ten.

DNS kurz erklärt

Das Domain Name Sys­tem (DNS) ist das Adress­buch des Inter­nets. Es über­setzt Domain­na­men – etwa compose-it.de – in nume­ri­sche IP-Adres­sen, damit Com­pu­ter sie ansteu­ern kön­nen. Wenn die­se Namens­auf­lö­sung nicht funk­tio­niert, bleibt selbst die moderns­te Cloud unsicht­bar. DNS-Feh­ler gehö­ren des­halb zu den sel­te­nen, aber fol­gen­reichs­ten Stö­run­gen im glo­ba­len Netz­be­trieb.

Wenn Gigan­ten stol­pern – das Risi­ko der Hypers­ca­ler

Dass ein Aus­fall die­ser Grö­ßen­ord­nung über­haupt mög­lich ist, über­rascht nur auf den ers­ten Blick. Hypers­ca­ler wie AWS, Micro­soft Azu­re oder Goog­le Cloud sind so kon­stru­iert, dass sie auf maxi­ma­le Effi­zi­enz, Aus­las­tung und Ska­lier­bar­keit aus­ge­legt sind. Die­se Stär­ke ist zugleich ihre Achil­les­fer­se: Wer welt­weit Mil­li­ar­den von Ver­bin­dun­gen koor­di­niert, schafft zwangs­läu­fig zen­tra­le Abhän­gig­kei­ten.

Als ein­zel­ne Regi­on ins Wan­ken geriet, zeig­te sich, wie ver­netzt und zugleich ver­letz­lich die­se Sys­te­me sind. Diens­te wie Can­va oder Slack betrei­ben ihre Anwen­dun­gen zwar glo­bal, ihre Authen­ti­fi­zie­rung, Spei­cher oder API-Gate­ways lau­fen jedoch oft auf weni­gen Kno­ten­punk­ten. Wenn einer davon aus­fällt, kann das für Stun­den gan­ze Öko­sys­te­me aus­brem­sen.

Es wäre zu kurz gegrif­fen, dar­aus eine Ankla­ge gegen Hypers­ca­ler zu machen. Im Gegen­teil – ihre Zuver­läs­sig­keit ist beein­dru­ckend. Aber: Zen­tra­li­sie­rung erzeugt immer auch Risi­ken. Und wenn etwas aus­fällt, dann fällt es nicht regio­nal aus, son­dern glo­bal.

Der Vor­fall ver­deut­licht damit eine ein­fa­che Wahr­heit, die im Cloud-Zeit­al­ter leicht ver­ges­sen wird: Ver­füg­bar­keit ist kein Zustand, son­dern ein Ver­spre­chen. Und jedes Ver­spre­chen braucht Ver­trau­en.

Ver­trau­en ist kein Daten­blatt­wert

Ver­trau­en ent­steht nicht durch Pro­zent­zah­len in einem Ser­vice Level Agree­ment. Es ent­steht durch Ver­läss­lich­keit, Kom­mu­ni­ka­ti­on und Nähe. Wenn ein Hypers­ca­ler eine Stö­rung hat, infor­miert er über Sta­tus­sei­ten und API-Mel­dun­gen – sach­lich, kor­rekt, auto­ma­ti­siert. Aber nie­mand ruft an, nie­mand erklärt, was das kon­kret für ein Unter­neh­men bedeu­tet, das gera­de kei­ne Rech­nun­gen ver­sen­den oder Kun­den­da­ten abru­fen kann.

Das ist kein Vor­wurf, son­dern ein struk­tu­rel­les Fak­tum. Ein glo­ba­ler Anbie­ter kann kei­ne per­sön­li­che Kom­mu­ni­ka­ti­on in Kri­sen leis­ten. Sei­ne Stär­ke liegt in Stan­dar­di­sie­rung und Auto­ma­ti­sie­rung. Genau dort aber unter­schei­det sich die Erfah­rung zwi­schen einem anony­men Sys­tem­sta­tus und einem greif­ba­ren Ansprech­part­ner.

In vie­len mit­tel­stän­di­schen Unter­neh­men gilt: Wenn ein Sys­tem steht, zählt jedes Wort. Nicht nur das, was tech­nisch geschieht, son­dern auch, wie infor­miert wird. Ver­trau­en in IT ent­steht aus der Gewiss­heit, dass jemand zuhört – und Ver­ant­wor­tung über­nimmt.

Betrof­fe­ne Diens­te beim Ama­zon Web Ser­vices-Aus­fall am 20. Okto­ber 2025

Die­se Lis­te ist mit­tels KI und Goog­le-Recher­che zusam­men­ge­tra­gen. Sie ist sicher nicht voll­stän­dig, zeigt jedoch einen guten Quer­schnitt über die Trag­wei­te des Aus­falls.

Dienst/PlattformKate­go­rieAus­wir­kung
Amazon.comE‑CommerceWeb­site und Diens­te zeit­wei­se nicht erreich­bar
Ale­xaSmart Home / Sprach­as­sis­tenzSprach­be­feh­le nicht ver­ar­bei­tet, Gerä­te off­line
Ama­zon MusicStrea­mingStrea­ming-Diens­te zeit­wei­se unter­bro­chen
Prime VideoStrea­mingZugriff auf Filme/Serien ein­ge­schränkt
RingSmart Home / Sicher­heitKame­ras reagier­ten ver­zö­gert
Snap­chatSocial MediaNach­rich­ten­ver­sand unter­bro­chen
Red­ditCom­mu­ni­tyWeb/App nicht erreich­bar
SlackKom­mu­ni­ka­ti­onVer­bin­dungs­pro­ble­me und Aus­fäl­le
ZoomVideo­kon­fe­renzVer­bin­dungs­pro­ble­me
Can­vaDesign / Krea­tivDienst off­line, Log­in gestört
Asa­naPro­duk­ti­vi­tätAuf­ga­ben­ver­wal­tung gestört
Duo­lin­goLer­nenApp off­line oder ver­zö­gert
Fig­maDesign / Col­la­bo­ra­ti­onPro­jek­te nicht syn­chro­ni­siert
Noti­onPro­duk­ti­vi­tätDaten­ban­ken und Sei­ten nicht erreich­bar
Fort­ni­teGam­ingLog­in-Ser­ver aus­ge­fal­len
RobloxGam­ingPlatt­form glo­bal nicht erreich­bar
Epic Games StoreGam­ing / Dis­tri­bu­ti­onDownload/Shop off­line
Ven­moFin­TechZah­lun­gen ver­zö­gert oder nicht mög­lich
Coin­ba­seKryp­to / Finan­zenTrans­ak­tio­nen aus­ge­setzt
Robin­hoodTra­dingApp off­line oder ver­zö­gert
Blink Secu­ri­tySmart Home / Sicher­heitGerä­te off­line
Cloud­fla­reInfra­struk­tur / DNSPro­pa­ga­ti­on-Delays beob­ach­tet
Git­Hub ActionsDevOpsWork­flows aus­ge­fal­len
Atlas­si­an CloudPro­duk­ti­vi­tät / Jira / Con­fluenceTeil­wei­se Aus­fäl­le
Stra­vaFit­ness / SocialTrack­ing-Daten nicht gela­den
Event­bri­teEvents / Ticke­tingTicket­kauf gestört
MyFit­ness­PalGesund­heit / Ernäh­rungSync-Pro­ble­me gemel­det
Drop­boxSpei­cher / CloudUploads feh­ler­haft
Ado­be Crea­ti­ve CloudDesign / Cloud Ser­vicesLog­in-Feh­ler und Time­outs
Dis­cordKom­mu­ni­ka­ti­on / Gam­ingSprach­diens­te beein­träch­tigt
SignalMes­sa­ging / Daten­schutzNach­rich­ten ver­zö­gert
Hug­ging FaceAI / Cloud APIModel Hos­ting nicht erreich­bar
Grammar­lyPro­duk­ti­vi­tät / AIEdi­tor-Diens­te gestört
ZapierAuto­ma­ti­sie­rungWork­flows ver­zö­gert oder gestoppt
Ope­nAI APIAI / API Ser­vicesIndi­rekt betrof­fen durch AWS Gate­way
Per­ple­xi­ty AIAI / SucheSer­vice-Aus­fall gemel­det
MiroCol­la­bo­ra­ti­on / White­boardBoard-Zugriff feh­ler­haft
Trel­loPro­jekt­ma­nage­mentBoards nicht gela­den
Base­campPro­jekt­ma­nage­mentLog­in-Pro­ble­me
Hub­S­potCRM / Mar­ke­tingDash­board und API down
Fresh­deskCus­to­mer Ser­viceSup­port-Por­ta­le nicht erreich­bar
Zen­deskSup­port / CRMTicket-Backend gestört
Khan Aca­de­myBil­dungLern­in­hal­te nicht ver­füg­bar
Cour­se­raE‑LearningWeb­site lang­sam oder off­line
Ser­viceNowEnter­pri­se / ITSMPor­tal-Zugriff feh­ler­haft
Sales­forceCRM / CloudAPI-Ant­wor­ten ver­zö­gert
Shop­i­fyE‑CommerceShops welt­weit mit Lade­pro­ble­men
WordPress.comWeb Hos­tingTime­outs beim Log­in
Squa­re­spaceWeb / CMSVer­öf­fent­li­chung nicht mög­lich
TwitchStrea­mingStreams unter­bro­chen
Spo­ti­fyStrea­ming / AudioEin­zel­ne Ser­ver reagier­ten nicht
Net­flix (Teil-Impact)Strea­mingRou­ting-Pro­ble­me über AWS-Edge
BBC iPlay­erStrea­mingKurz­zei­ti­ge Stö­run­gen
Lloyds BankFinan­zen / Ban­kingOnline­ban­king-Aus­fall
Bank of Scot­landFinan­zen / Ban­kingKon­to­ab­fra­gen nicht mög­lich
HMRC (UK Gov)Behör­deGate­way-Pro­ble­me regis­triert
NHS AppGesund­heits­diens­teZugriff gestört
Pelo­tonFit­nessApp-Strea­ming off­line

Pri­va­te Cloud als bewuss­te Ent­schei­dung

Vie­le Unter­neh­men haben sich bewusst gegen die tota­le Abhän­gig­keit von den gro­ßen Cloud­platt­for­men ent­schie­den. Nicht aus Miss­trau­en, son­dern aus Prag­ma­tis­mus. Pri­va­te-Cloud-Anbie­ter oder regio­na­le Rechen­zen­tren schaf­fen Frei­räu­me, die über rei­ne Tech­no­lo­gie hin­aus­ge­hen: Nähe, Erreich­bar­keit und das Gefühl, die eige­ne Infra­struk­tur wirk­lich zu ver­ste­hen.

Wäh­rend Hypers­ca­ler auf welt­wei­te Red­un­danz set­zen, bie­ten pri­va­te Betrei­ber eine ande­re Form von Sicher­heit – durch per­sön­li­che Betreu­ung, trans­pa­ren­te Pro­zes­se und kur­ze Kom­mu­ni­ka­ti­ons­we­ge. Ein Admi­nis­tra­tor, der die Sys­te­me sei­ner Kun­den kennt, reagiert anders als ein glo­ba­les Sup­port-Ticket.

Die­se Nähe bedeu­tet nicht, dass pri­va­te Anbie­ter unab­hän­gig von glo­ba­len Struk­tu­ren wären. Auch sie sind auf DNS, Inter­net-Back­bones oder Zer­ti­fi­zie­rungs­stel­len ange­wie­sen. Aber der ent­schei­den­de Unter­schied liegt im Umgang mit Stö­run­gen. Pri­va­te Clouds reagie­ren dort, wo ande­re nur kom­mu­ni­zie­ren. Sie kön­nen direkt ein­grei­fen, Sys­te­me prio­ri­sie­ren und indi­vi­du­ell infor­mie­ren.

Pri­va­te Rechen­zen­tren ste­hen damit nicht im Gegen­satz zu den Hypers­ca­lern, son­dern ergän­zen sie. Sie bil­den die ver­läss­li­che Ebe­ne zwi­schen glo­ba­ler Infra­struk­tur und rea­lem Geschäfts­be­trieb – eine Art Ver­trau­ens­an­ker im digi­ta­len All­tag.

Der Wert von Nähe in einer glo­ba­len Infra­struk­tur

Je grö­ßer und kom­ple­xer digi­ta­le Sys­te­me wer­den, des­to sel­te­ner tref­fen sich Betrei­ber und Nut­zer noch direkt. Cloud-Diens­te funk­tio­nie­ren weit­ge­hend auto­ma­ti­siert, Kom­mu­ni­ka­ti­on läuft über Dash­boards, Tickets und Chat­bots. Doch wenn etwas aus­fällt, zeigt sich, wie wert­voll der mensch­li­che Fak­tor bleibt.

Vie­le Unter­neh­men, die in regio­na­len Rechen­zen­tren hos­ten, schät­zen genau die­se Erreich­bar­keit. Ein Anruf genügt, und jemand kennt das Sys­tem, die Abhän­gig­kei­ten und die His­to­rie. Kei­ne War­te­schlei­fe, kei­ne Stan­dard­ant­wor­ten, son­dern kon­kre­te Ein­schät­zun­gen. Die­se Nähe ist kein tech­ni­scher Vor­teil, son­dern ein kul­tu­rel­ler. Sie schafft Ruhe in Momen­ten, in denen Tech­nik ver­sagt.

Auch bei COMPOSE IT oder ande­ren pri­va­ten Cloud-Anbie­tern spielt die­se Hal­tung eine zen­tra­le Rol­le. Man kann tech­ni­sche Pro­ble­me nicht immer ver­hin­dern, aber man kann sie begreif­bar machen. Ver­trau­en ent­steht dort, wo Kom­mu­ni­ka­ti­on nach­voll­zieh­bar und Reak­ti­on spür­bar bleibt.

Der AWS-Aus­fall hat gezeigt, dass Ver­füg­bar­keit zwar glo­bal ver­teilt, Ver­ant­wor­tung aber immer lokal emp­fun­den wird.

Was Unter­neh­men aus dem AWS-Aus­fall ler­nen kön­nen

Der Vor­fall vom 20. Okto­ber 2025 ist weni­ger eine tech­ni­sche Pan­ne als ein Lehr­stück über Abhän­gig­kei­ten. Vie­le Unter­neh­men haben erst­mals gespürt, dass selbst moderns­te Cloud­sys­te­me kei­ne abso­lu­te Sta­bi­li­tät garan­tie­ren kön­nen. Es geht nicht dar­um, sich von Hypers­ca­lern abzu­wen­den – son­dern dar­um, bewuss­ter mit der eige­nen IT-Archi­tek­tur umzu­ge­hen.

Zu den wich­tigs­ten Leh­ren gehört, Red­un­danz neu zu den­ken. Eine Mul­ti-Regi­on-Stra­te­gie inner­halb des­sel­ben Anbie­ters reicht oft nicht aus, wenn alle Regio­nen den­sel­ben glo­ba­len Kon­troll­me­cha­nis­men unter­lie­gen. Wer kri­tisch arbei­tet – etwa im Gesund­heits­we­sen, im Finanz­sek­tor oder in der Indus­trie –, soll­te stets Alter­na­ti­ven defi­nie­ren: Back­ups, hybri­de Archi­tek­tu­ren, pri­va­te Clus­ter.

Eben­so wich­tig ist die Kom­mu­ni­ka­ti­on. Unter­neh­men, die im Ernst­fall mit ihren Anbie­tern offen und direkt spre­chen kön­nen, gewin­nen Zeit und Hand­lungs­spiel­raum. Denn wäh­rend eine Stö­rung tech­nisch kom­plex sein kann, ist ihre Wir­kung meist ganz ein­fach: Unsi­cher­heit. Und Unsi­cher­heit lässt sich am bes­ten durch Nähe abbau­en.

Der Aus­fall von AWS war ein sicht­ba­rer Remin­der: Ver­trau­en ent­steht nicht aus Ver­spre­chen, son­dern aus Erfah­rung – und aus Struk­tu­ren, die das Ver­trau­en im Ernst­fall tra­gen kön­nen.

Fazit – Cloud-Ver­trau­en neu den­ken

Der Aus­fall von AWS am 20. Okto­ber 2025 war kein Aus­nah­me­zu­stand, son­dern ein Sym­ptom einer digi­tal ver­netz­ten Welt, in der selbst kleins­te Feh­ler glo­ba­le Fol­gen haben kön­nen. Er hat nichts an der Bedeu­tung der gro­ßen Platt­for­men geän­dert, aber vie­les über das Ver­hält­nis zwi­schen Tech­no­lo­gie und Ver­trau­en offen­ge­legt.

Clouds sind kei­ne Natur­ge­wal­ten, son­dern men­schen­ge­mach­te Sys­te­me. Sie leben von Trans­pa­renz, Red­un­danz und Ver­ant­wort­lich­keit – und davon, wie offen ihre Betrei­ber mit Stö­run­gen umge­hen. Der Unter­schied liegt nicht im Auf­tre­ten von Aus­fäl­len, son­dern in der Art, wie dar­auf reagiert wird.

Pri­va­te und regio­na­le Clou­dan­bie­ter zei­gen, dass es auch anders geht: näher, kom­mu­ni­ka­ti­ver, nach­voll­zieh­ba­rer. Sie ste­hen nicht gegen die Hypers­ca­ler, son­dern ergän­zen sie. Zwi­schen glo­ba­ler Infra­struk­tur und loka­lem Ver­trau­en liegt kein Wider­spruch, son­dern eine Part­ner­schaft – eine, die gera­de im Ernst­fall ihren Wert beweist.

Am Ende bleibt eine ein­fa­che Erkennt­nis: Ver­füg­bar­keit ist eine Zahl. Ver­trau­en ist eine Erfah­rung. Und sie ent­steht über­all dort, wo Tech­nik mensch­lich bleibt.

In diesem Beitrag