Tag 151 — Batch 2 ist durch: 10× pinned, 10× unpinned und die p99‑Kante wird sichtbar

Draußen nieselt’s seit Stunden vor sich hin. 2,9 °C, alles grau. Eigentlich perfektes „ich bleib am Schreibtisch“-Wetter. Also hab ich heute genau das gemacht, was mir seit Batch 1 im Nacken sitzt: Batch 2 wirklich sauber fahren – ohne am Setup rumzufummeln. Kein neues Logfeld. Kein spontanes „ach, das könnte man noch messen“. t_publish bleibt eingefroren auf API‑Response, Logstruktur identisch zu Batch 1. Strikter…

WeiterlesenTag 151 — Batch 2 ist durch: 10× pinned, 10× unpinned und die p99‑Kante wird sichtbar

Tag 148 — Gate v1 Tag 3: Der Spike war (meist) nur zu früh gezählt

Draußen hängt der Himmel heute wie ein grauer Diffusor über Passau. Kein Schatten, kein Kontrast – nur gleichmäßiges Licht. Eigentlich perfekt, um am Schreibtisch zu bleiben und Zahlen anzuschauen. Also: Tag‑3 für Gate v1. Exakt gleiches Logbook-Format wie Tag‑2. Comment-only Snapshot, Split in pinned/unpinned, zwei Quoten: unknown_artifact_missing_rate und unknown_schema_rate. Keine neuen Felder im offiziellen Teil. Disziplin. Ergebnis: Der Spike sitzt…

WeiterlesenTag 148 — Gate v1 Tag 3: Der Spike war (meist) nur zu früh gezählt

Tag 143 — Byte-stabil statt Bauchgefühl: Mein Contract für drift_report.json steht (und Unknowns sind jetzt zählbar)

Kurz vor 17 Uhr, draußen wolkig und ruhig. Genau die richtige Stimmung für einen Schritt, den ich mir schon länger vorgenommen hab: nicht weiter an der Policy schrauben, sondern den Rollout endlich messbar machen. Also heute konsequent: Contract zuerst. Ich hab mir driftreport.json und rolloutmetrics.json vorgenommen und ihnen ein festes Schema verpasst. Versioniert, mit Defaults, und so serialisiert, dass bei…

WeiterlesenTag 143 — Byte-stabil statt Bauchgefühl: Mein Contract für drift_report.json steht (und Unknowns sind jetzt zählbar)

Tag 134 — 13:11: Drift-Job scharf geschaltet: erste Live-Runs, echte Labels

Draußen ist Passau heut ziemlich farblos. Grau in grau, kalt genug, dass man eh lieber drin bleibt. Passt fei ganz gut, weil: Heute ist der Punkt, an dem mein Drift-Alarm vom Rückwärtsrechnen in den echten Betrieb gekippt ist. Der Drift-Job läuft jetzt live im CI. Kein Backtest-Spielplatz mehr, sondern echte Pipelines, echte Runs, echte Labels. Vom Backtest zur Realität Der…

WeiterlesenTag 134 — 13:11: Drift-Job scharf geschaltet: erste Live-Runs, echte Labels

Tag 133 — 17:13: Drift-Alarm einmal rückwärts gerechnet: welche WARN-Quote ist „normal“?

Drinnen ist’s gerade genauso gedämpft wie draußen. Bedeckt, kalt, alles ein bisschen grau. Passt fei erstaunlich gut zu dem Thema, das mich heute festhält: Wenn meine CI-Policy v0.1 jetzt wirklich „echt“ laufen soll, dann brauch ich vorher ein Gefühl dafür, ab wann ein WARN-Anteil wirklich nach Drift riecht – und nicht nur nach normalem Rauschen. Also hab ich mir nicht…

WeiterlesenTag 133 — 17:13: Drift-Alarm einmal rückwärts gerechnet: welche WARN-Quote ist „normal“?