AWS Ausfall 2025: Warum Vertrauen in Hyperscaler keine Selbstverständlichkeit ist

Der Morgen, an dem Alexa schwieg.

Am Montagmorgen des 20. Oktober 2025 wurde das Internet für Millionen von Nutzern kurzzeitig kleiner. Amazon Web Services, kurz AWS, meldete ab 9:30 Uhr mitteleuropäischer Zeit massive Störungen in der Region us-east-1. Zahlreiche Plattformen, von Snapchat über Asana bis hin zu Canva, waren über Stunden hinweg nur eingeschränkt oder gar nicht erreichbar. Selbst Amazons eigene Dienste wie Alexa oder Prime Video reagierten nicht.

Was zunächst wie eine Randnotiz für Technik-Portale wirkte, entpuppte sich binnen Minuten als globaler Dominoeffekt. Denn wer heute im Internet arbeitet, arbeitet fast zwangsläufig auf Infrastruktur, die aus Rechenzentren weniger Anbieter gespeist wird. Der Ausfall einer Region genügte, um die Verwundbarkeit dieser hochzentralisierten Architektur sichtbar zu machen.

Während die Störung inzwischen behoben ist, bleibt die Frage: Wie viel Vertrauen dürfen Unternehmen eigentlich in Strukturen setzen, die sie selbst kaum mehr überblicken – und die im Zweifel tausende Kilometer entfernt verwaltet werden?

Was am 20. Oktober 2025 wirklich geschah

Nach Angaben von Amazon Web Services begann die Störung in der Region US-EAST-1 gegen 03:30 UTC. Zahlreiche Dienste meldeten „increased error rates“ – eine technische Umschreibung für: nichts ging mehr. Betroffen waren unter anderem die Datenbankplattform Amazon DynamoDB sowie zentrale Komponenten des Domain Name System (DNS), über das Servernamen in IP-Adressen übersetzt werden.

In der Folge konnten Anwendungen, die in dieser Region betrieben oder über sie adressiert wurden, keine Verbindung mehr zu ihren Backend-Systemen herstellen. Das betraf nicht nur AWS-eigene Angebote, sondern auch Hunderte populäre SaaS-Dienste – von Slack über Zoom bis Coinbase. Die Auswirkungen reichten bis in Bereiche, die mit AWS auf den ersten Blick wenig zu tun haben: Zahlungsdienste, Bildungsplattformen, Streaming-Anbieter.

AWS Ausfall 2025: Das AWS-Rechenzentrum "AWS US EAST 1" in Ashton, USA

Laut Reuters dauerte es rund sechs Stunden, bis alle Systeme wiederhergestellt waren. Offiziell sprach AWS später von einem „DNS resolution issue“, ausgelöst durch eine Fehlkonfiguration in der Netzwerk-Kommunikation von DynamoDB-Endpunkten.

DNS kurz erklärt

Das Domain Name System (DNS) ist das Adressbuch des Internets. Es übersetzt Domainnamen – etwa compose-it.de – in numerische IP-Adressen, damit Computer sie ansteuern können. Wenn diese Namensauflösung nicht funktioniert, bleibt selbst die modernste Cloud unsichtbar. DNS-Fehler gehören deshalb zu den seltenen, aber folgenreichsten Störungen im globalen Netzbetrieb.

Wenn Giganten stolpern – das Risiko der Hyperscaler

Dass ein Ausfall dieser Größenordnung überhaupt möglich ist, überrascht nur auf den ersten Blick. Hyperscaler wie AWS, Microsoft Azure oder Google Cloud sind so konstruiert, dass sie auf maximale Effizienz, Auslastung und Skalierbarkeit ausgelegt sind. Diese Stärke ist zugleich ihre Achillesferse: Wer weltweit Milliarden von Verbindungen koordiniert, schafft zwangsläufig zentrale Abhängigkeiten.

Als einzelne Region ins Wanken geriet, zeigte sich, wie vernetzt und zugleich verletzlich diese Systeme sind. Dienste wie Canva oder Slack betreiben ihre Anwendungen zwar global, ihre Authentifizierung, Speicher oder API-Gateways laufen jedoch oft auf wenigen Knotenpunkten. Wenn einer davon ausfällt, kann das für Stunden ganze Ökosysteme ausbremsen.

Es wäre zu kurz gegriffen, daraus eine Anklage gegen Hyperscaler zu machen. Im Gegenteil – ihre Zuverlässigkeit ist beeindruckend. Aber: Zentralisierung erzeugt immer auch Risiken. Und wenn etwas ausfällt, dann fällt es nicht regional aus, sondern global.

Der Vorfall verdeutlicht damit eine einfache Wahrheit, die im Cloud-Zeitalter leicht vergessen wird: Verfügbarkeit ist kein Zustand, sondern ein Versprechen. Und jedes Versprechen braucht Vertrauen.

Vertrauen ist kein Datenblattwert

Vertrauen entsteht nicht durch Prozentzahlen in einem Service Level Agreement. Es entsteht durch Verlässlichkeit, Kommunikation und Nähe. Wenn ein Hyperscaler eine Störung hat, informiert er über Statusseiten und API-Meldungen – sachlich, korrekt, automatisiert. Aber niemand ruft an, niemand erklärt, was das konkret für ein Unternehmen bedeutet, das gerade keine Rechnungen versenden oder Kundendaten abrufen kann.

Das ist kein Vorwurf, sondern ein strukturelles Faktum. Ein globaler Anbieter kann keine persönliche Kommunikation in Krisen leisten. Seine Stärke liegt in Standardisierung und Automatisierung. Genau dort aber unterscheidet sich die Erfahrung zwischen einem anonymen Systemstatus und einem greifbaren Ansprechpartner.

In vielen mittelständischen Unternehmen gilt: Wenn ein System steht, zählt jedes Wort. Nicht nur das, was technisch geschieht, sondern auch, wie informiert wird. Vertrauen in IT entsteht aus der Gewissheit, dass jemand zuhört – und Verantwortung übernimmt.

Betroffene Dienste beim Amazon Web Services-Ausfall am 20. Oktober 2025

Diese Liste ist mittels KI und Google-Recherche zusammengetragen. Sie ist sicher nicht vollständig, zeigt jedoch einen guten Querschnitt über die Tragweite des Ausfalls.

Dienst/PlattformKategorieAuswirkung
Amazon.comE-CommerceWebsite und Dienste zeitweise nicht erreichbar
AlexaSmart Home / SprachassistenzSprachbefehle nicht verarbeitet, Geräte offline
Amazon MusicStreamingStreaming-Dienste zeitweise unterbrochen
Prime VideoStreamingZugriff auf Filme/Serien eingeschränkt
RingSmart Home / SicherheitKameras reagierten verzögert
SnapchatSocial MediaNachrichtenversand unterbrochen
RedditCommunityWeb/App nicht erreichbar
SlackKommunikationVerbindungsprobleme und Ausfälle
ZoomVideokonferenzVerbindungsprobleme
CanvaDesign / KreativDienst offline, Login gestört
AsanaProduktivitätAufgabenverwaltung gestört
DuolingoLernenApp offline oder verzögert
FigmaDesign / CollaborationProjekte nicht synchronisiert
NotionProduktivitätDatenbanken und Seiten nicht erreichbar
FortniteGamingLogin-Server ausgefallen
RobloxGamingPlattform global nicht erreichbar
Epic Games StoreGaming / DistributionDownload/Shop offline
VenmoFinTechZahlungen verzögert oder nicht möglich
CoinbaseKrypto / FinanzenTransaktionen ausgesetzt
RobinhoodTradingApp offline oder verzögert
Blink SecuritySmart Home / SicherheitGeräte offline
CloudflareInfrastruktur / DNSPropagation-Delays beobachtet
GitHub ActionsDevOpsWorkflows ausgefallen
Atlassian CloudProduktivität / Jira / ConfluenceTeilweise Ausfälle
StravaFitness / SocialTracking-Daten nicht geladen
EventbriteEvents / TicketingTicketkauf gestört
MyFitnessPalGesundheit / ErnährungSync-Probleme gemeldet
DropboxSpeicher / CloudUploads fehlerhaft
Adobe Creative CloudDesign / Cloud ServicesLogin-Fehler und Timeouts
DiscordKommunikation / GamingSprachdienste beeinträchtigt
SignalMessaging / DatenschutzNachrichten verzögert
Hugging FaceAI / Cloud APIModel Hosting nicht erreichbar
GrammarlyProduktivität / AIEditor-Dienste gestört
ZapierAutomatisierungWorkflows verzögert oder gestoppt
OpenAI APIAI / API ServicesIndirekt betroffen durch AWS Gateway
Perplexity AIAI / SucheService-Ausfall gemeldet
MiroCollaboration / WhiteboardBoard-Zugriff fehlerhaft
TrelloProjektmanagementBoards nicht geladen
BasecampProjektmanagementLogin-Probleme
HubSpotCRM / MarketingDashboard und API down
FreshdeskCustomer ServiceSupport-Portale nicht erreichbar
ZendeskSupport / CRMTicket-Backend gestört
Khan AcademyBildungLerninhalte nicht verfügbar
CourseraE-LearningWebsite langsam oder offline
ServiceNowEnterprise / ITSMPortal-Zugriff fehlerhaft
SalesforceCRM / CloudAPI-Antworten verzögert
ShopifyE-CommerceShops weltweit mit Ladeproblemen
WordPress.comWeb HostingTimeouts beim Login
SquarespaceWeb / CMSVeröffentlichung nicht möglich
TwitchStreamingStreams unterbrochen
SpotifyStreaming / AudioEinzelne Server reagierten nicht
Netflix (Teil-Impact)StreamingRouting-Probleme über AWS-Edge
BBC iPlayerStreamingKurzzeitige Störungen
Lloyds BankFinanzen / BankingOnlinebanking-Ausfall
Bank of ScotlandFinanzen / BankingKontoabfragen nicht möglich
HMRC (UK Gov)BehördeGateway-Probleme registriert
NHS AppGesundheitsdiensteZugriff gestört
PelotonFitnessApp-Streaming offline

Private Cloud als bewusste Entscheidung

Viele Unternehmen haben sich bewusst gegen die totale Abhängigkeit von den großen Cloudplattformen entschieden. Nicht aus Misstrauen, sondern aus Pragmatismus. Private-Cloud-Anbieter oder regionale Rechenzentren schaffen Freiräume, die über reine Technologie hinausgehen: Nähe, Erreichbarkeit und das Gefühl, die eigene Infrastruktur wirklich zu verstehen.

Während Hyperscaler auf weltweite Redundanz setzen, bieten private Betreiber eine andere Form von Sicherheit – durch persönliche Betreuung, transparente Prozesse und kurze Kommunikationswege. Ein Administrator, der die Systeme seiner Kunden kennt, reagiert anders als ein globales Support-Ticket.

Diese Nähe bedeutet nicht, dass private Anbieter unabhängig von globalen Strukturen wären. Auch sie sind auf DNS, Internet-Backbones oder Zertifizierungsstellen angewiesen. Aber der entscheidende Unterschied liegt im Umgang mit Störungen. Private Clouds reagieren dort, wo andere nur kommunizieren. Sie können direkt eingreifen, Systeme priorisieren und individuell informieren.

Private Rechenzentren stehen damit nicht im Gegensatz zu den Hyperscalern, sondern ergänzen sie. Sie bilden die verlässliche Ebene zwischen globaler Infrastruktur und realem Geschäftsbetrieb – eine Art Vertrauensanker im digitalen Alltag.

Der Wert von Nähe in einer globalen Infrastruktur

Je größer und komplexer digitale Systeme werden, desto seltener treffen sich Betreiber und Nutzer noch direkt. Cloud-Dienste funktionieren weitgehend automatisiert, Kommunikation läuft über Dashboards, Tickets und Chatbots. Doch wenn etwas ausfällt, zeigt sich, wie wertvoll der menschliche Faktor bleibt.

Viele Unternehmen, die in regionalen Rechenzentren hosten, schätzen genau diese Erreichbarkeit. Ein Anruf genügt, und jemand kennt das System, die Abhängigkeiten und die Historie. Keine Warteschleife, keine Standardantworten, sondern konkrete Einschätzungen. Diese Nähe ist kein technischer Vorteil, sondern ein kultureller. Sie schafft Ruhe in Momenten, in denen Technik versagt.

Auch bei COMPOSE IT oder anderen privaten Cloud-Anbietern spielt diese Haltung eine zentrale Rolle. Man kann technische Probleme nicht immer verhindern, aber man kann sie begreifbar machen. Vertrauen entsteht dort, wo Kommunikation nachvollziehbar und Reaktion spürbar bleibt.

Der AWS-Ausfall hat gezeigt, dass Verfügbarkeit zwar global verteilt, Verantwortung aber immer lokal empfunden wird.

Was Unternehmen aus dem AWS-Ausfall lernen können

Der Vorfall vom 20. Oktober 2025 ist weniger eine technische Panne als ein Lehrstück über Abhängigkeiten. Viele Unternehmen haben erstmals gespürt, dass selbst modernste Cloudsysteme keine absolute Stabilität garantieren können. Es geht nicht darum, sich von Hyperscalern abzuwenden – sondern darum, bewusster mit der eigenen IT-Architektur umzugehen.

Zu den wichtigsten Lehren gehört, Redundanz neu zu denken. Eine Multi-Region-Strategie innerhalb desselben Anbieters reicht oft nicht aus, wenn alle Regionen denselben globalen Kontrollmechanismen unterliegen. Wer kritisch arbeitet – etwa im Gesundheitswesen, im Finanzsektor oder in der Industrie –, sollte stets Alternativen definieren: Backups, hybride Architekturen, private Cluster.

Ebenso wichtig ist die Kommunikation. Unternehmen, die im Ernstfall mit ihren Anbietern offen und direkt sprechen können, gewinnen Zeit und Handlungsspielraum. Denn während eine Störung technisch komplex sein kann, ist ihre Wirkung meist ganz einfach: Unsicherheit. Und Unsicherheit lässt sich am besten durch Nähe abbauen.

Der Ausfall von AWS war ein sichtbarer Reminder: Vertrauen entsteht nicht aus Versprechen, sondern aus Erfahrung – und aus Strukturen, die das Vertrauen im Ernstfall tragen können.

Fazit – Cloud-Vertrauen neu denken

Der Ausfall von AWS am 20. Oktober 2025 war kein Ausnahmezustand, sondern ein Symptom einer digital vernetzten Welt, in der selbst kleinste Fehler globale Folgen haben können. Er hat nichts an der Bedeutung der großen Plattformen geändert, aber vieles über das Verhältnis zwischen Technologie und Vertrauen offengelegt.

Clouds sind keine Naturgewalten, sondern menschengemachte Systeme. Sie leben von Transparenz, Redundanz und Verantwortlichkeit – und davon, wie offen ihre Betreiber mit Störungen umgehen. Der Unterschied liegt nicht im Auftreten von Ausfällen, sondern in der Art, wie darauf reagiert wird.

Private und regionale Cloudanbieter zeigen, dass es auch anders geht: näher, kommunikativer, nachvollziehbarer. Sie stehen nicht gegen die Hyperscaler, sondern ergänzen sie. Zwischen globaler Infrastruktur und lokalem Vertrauen liegt kein Widerspruch, sondern eine Partnerschaft – eine, die gerade im Ernstfall ihren Wert beweist.

Am Ende bleibt eine einfache Erkenntnis: Verfügbarkeit ist eine Zahl. Vertrauen ist eine Erfahrung. Und sie entsteht überall dort, wo Technik menschlich bleibt.

In diesem Beitrag