Downtime 1 Stunde?

Nun läuft der Zähler wieder. Und wir hoffen, dass fehlende Daten der letzten Tage nachgeliefert werden. Ob man das mit dem Backup nun endlich hinbekommt?

Eins ist in der Zwischenzeit wohl ganz klar, die aktuelle Kompetenz der IT-Mannschaft ist den Herausforderungen dieser hochkomplexen Installation in keiner Weise gewachsen und hat sie nicht in der Hand. Ausfälle und Downtimes können vorkommen aber nicht in dem zeitlichen Ausmass und der Häufigkeit…

3 „Gefällt mir“

Und wieder kaputt, :upside_down_face: :slightly_smiling_face:

Unglaublich. !7Uhr und eine Stunde Wartung ok aber 11h später geht noch immer nix.

Auch jetzt noch alles tot.
Wenn die das nicht heute schnell hinbekommen dann wird es dieses Jahr Nix mehr und wir warten bis zum 8.1.24.
Naja egal, der Zähler fliegt ja sowieso raus sobald der Netzbetreiber nen Termin für den Wechsel nennt.

Ebenfalls noch alles tot.

Bei mir ist auch noch alles weg.
Welche Alternativen haben wir?
Lesekopf wie bei Tibber, sonst noch was?

Wahnsinn, super Timing.

Die Daten von gestern wurden wohl nachgeliefert, aber sein heute 00:39 wieder alles tot.

Es gibt aktuell für mich weder ein Login im Portal, noch via App. Für mich sieht das wie „komplett down“ aus. Über die API kommen seit 21.12.23 17:12 Uhr keine Daten mehr :frowning: Hoffen wir mal, dass die Daten, gerade bei den aktuellen Preisen, auch korrekt übergeben werden

Nun weiss Discovergy auf jeden Fall, wie man einen IT-Change nich durchführt.
Ohne Rollback-Plan geht man nicht an den Start. Der Rollbvack startet, wenn bei der Ausführung der geplanten Implementierung Fehler auftreten. Und man lässt das keine Softwareentwickler machen. Die dürfen nur testen.

Das Stichwort ist ITIL.
Change Management (ITIL) – Wikipedia.

1 „Gefällt mir“

Gateway seit 01:20 wieder offline, App außer Funktion…:scream:

… einfach die Instanz anhalten.

Eben nicht, der Zähler liefert ja, sobald es wieder geht. und bei Start der Instanz wird der letzte gelesene Wert geliefert, der Adapter liest halt nur ‚last‘…

Das wurde durch ITIL V4 verweichlicht. Das neue Stichwort ist DevOps :slight_smile:
Aber ja: Hier sind definitiv Amateure am Werk.

In der Zwischenzeit müssten doch wohl schon die ersten Mitarbeiter eingetrudelt sein und die schöne Bescherung aufräumen ?

Im Ernst, jetzt kommt gleich Herr Santiago, den ich übrigens als Mensch sehr schätze und auch in seiner Funktion hier sehr bedauere, und muss sich dann mit übertriebener Freundlichkeit hier wieder hergeben als Erklärbär, Entschuldigungsbär usw…

2 „Gefällt mir“

Auch bei mir tut sich bisher leider gar nichts. In der App habe ich lediglich den drehenden Kreis …

Liebe Kundinnen und Kunden,

wir möchten uns aufrichtig für den Ausfall seit gestern Abend entschuldigen und bedauern die fehlende Kommunikation meinerseits seitdem. Gestern ging ich in den Feierabend in der festen Überzeugung, dass die geplante Wartungsarbeit reibungslos verlaufen würde. Leider stellte sich heraus, dass diese komplexer waren als erwartet – wie Sie möglicherweise bereits bemerkt haben –, wodurch unsere Kollegen gestern nicht in der Lage waren, die Systeme wieder hochzufahren.

Derzeit verfüge ich über begrenzte Informationen, doch unsere IT-Abteilung arbeitet mit Hochdruck an der Lösung des Problems. Es wird voraussichtlich noch einige Stunden dauern, bis der Ausfall behoben ist. Wir bitten um Ihr Verständnis und versichern Ihnen, dass wir alles in unserer Macht Stehende tun, um die Systeme so schnell wie möglich wieder voll funktionsfähig zu machen.

Vielen Dank für Ihr Verständnis und Ihre Geduld.
Pablo Santiago, Discovergy GmbH

4 „Gefällt mir“

Eine Trennung zwingt die Entwicklung so zu paketieren, dass Operation die Dinge mit einem überschaubaren Aufwand zu deployen. Gleichzeitig entstehen so zusätzliche Tests. Z.B. in einem Abnahmesystem. Und natürlich macht man, in Abhängigkeit vom Umfang des Changes, immer eine frisches Backup. Gestern Abend habe die wohl wieder das „neuste“ Backup eingespielt, dass wohl am 15.12. durchgeführt wurde. In Zeiten, wo alles virtualisiert wird, verstehe ich die Probleme eh nicht: Man hält die APi an, welche die Daten der Gateways empfängt, wartet, bis alle Daten verarbeitet wurden und macht dann einen Snapshot der VM’s. Nun kann man in Ruhe updaten und, mit hoffentlich vorhandenen, Test-Zählern prüfen ob alles funktioniert.

Rollback: VMs auf Snapshot zurücksetzen.

Snapshots ersetzen kein Backup und sind zudem im Datenbankumfeld mit Vorsicht zu behandeln!

Sicher. Snapshot als zusätzliche Maßnahe. Von der DB zieht man natürlich immer ein Backup.
Für weitere Konsistenz, kann man die DB vor dem Snapshot stoppen. Wir kennen ja alle den Umfang der Arbeiten nicht. Ich erstelle Snapshots vor Updates eh meist im ausgeschalteten Zustand der VM.