Microsoft liefert Details von Teams…
31. Januar 2023
Am 25.01. kam es zu einer weltweiten Störung von einigen Microsoft-Online-Diensten. Betroffen waren u.a. die Bürokommunikations-Plattform Teams, der E-Mail-Service Outlook und Cloud-basierende Versionen von Word und Excel. Die Ursache war ein geplanter Change an einem WAN-Router. Ein Router-Befehl verhält sich auf verschiedenen Routern nicht immer gleich und so hatte er auf der Routerplattform, auf der er ausgeführt wurde, nicht den vollständigen Qualifizierungsprozess durchlaufen.
Microsoft bemerkte den Ausfall bereits nach wenigen Minuten und konnte ein Review starten und nach einer Stunde begann ein automatisierter Recovery-Prozess im Netzwerk. Aufgrund des WAN-Ausfalls waren auch Automatisierungssysteme für das Monitoring und die automatisierte Außerbetriebnahme von nicht korrekt funktionierenden Netzwerkkomponenten außer Betrieb. Einige Router brauchten daher noch einen manuellen Neustart. Die gesamte Arbeit war bis zum frühen Nachmittag abgeschlossen.
Microsoft hat sofort darauf reagiert: Kommandos mit großem Impact werden nun geblockt und alle Ausführungen den „safe change guidelines“ unterworfen. Der gesamte Review des Vorfalls soll innerhalb von 14 Tagen veröffentlicht werden. Den vorläufigen Incident Report von Microsoft finden Sie hier.