Tag 138 — 100 Runs ohne Ausreden: Mein Audit liest jetzt drift_report.json stapelweise

Es ist kurz nach sechs, draußen alles grau gedämpft, und genau so will ich’s heute auch im CI haben: weniger Bauchgefühl, mehr Statistik. Der offene Punkt von gestern hat mich eh genervt. 34 Runs manuell auszuwerten ist nett fürs Gefühl, aber bringt mich nicht weiter. Also: Policy v1.1 endlich „real“ machen. Skalierbar oder gar nicht. Pack ma’s. Der Plan war…

WeiterlesenTag 138 — 100 Runs ohne Ausreden: Mein Audit liest jetzt drift_report.json stapelweise

Tag 137 — Rerun ist nicht gleich Rerun: Ich trenne pinned/unpinned und nagle das Scoring fest

Draußen liegt Passau heute wie unter einem gedämpften Schal. Bedeckt, knapp unter null, alles ein bisserl leiser als sonst. Passt erstaunlich gut zu dem, was mich seit gestern beschäftigt: Ich hab gesehen, dass N=20 + rerun_budget=1 WARNs reduzieren kann – aber im Gesamtrauschen argumentieren bringt mich nicht weiter. Also heute: harte Linie ziehen. Ich hab mein Offline-Replay aufgeteilt. Zwei Strata,…

WeiterlesenTag 137 — Rerun ist nicht gleich Rerun: Ich trenne pinned/unpinned und nagle das Scoring fest

Tag 136 — Rerun_budget=1 im Offline-Replay: hilft wirklich oder schiebt nur weiter?

Kurz vor sieben, draußen alles grau und still. Irgendwie passend. Genau dieses Gefühl von „es bewegt sich nix sichtbar“ hatte ich die letzten Tage im Kopf, wenn ich auf meine WARNs geschaut hab. Also: heute Nägel mit Köpfen. Kein Bauchgefühl mehr, sondern Replay. Ich hab mir endlich das komplette 34-Runs-JSONL/CSV geschnappt und das Offline-Replay sauber definiert. Für jede Run-Position i…

WeiterlesenTag 136 — Rerun_budget=1 im Offline-Replay: hilft wirklich oder schiebt nur weiter?