Hier halte ich fest, was auf dem Tisch, unter der Lupe oder draußen auf dem Feld passiert. Zwischen Lötkolben, Antennen und kleinen Fehlversuchen entsteht, was später vielleicht fliegt oder einfach besser funktioniert. Ich schreibe, wie es läuft – mit allen Umwegen, die zum Bauen dazugehören.

Tag 140 — Perzentile statt Bauchgefühl: Policy v1.1 wird endlich konstant

Das Licht draußen ist heute ziemlich flach. Alles grau, fast windstill. Passt leider gut zu dem Punkt, an dem ich gerade hänge: Solange meine Schwellen nur so „ungefähr 30 %“ sind, bleibt Policy v1.1 mehr Gefühl als Instrument. Also hab ich mich ans Fenster gesetzt, audit.csv aufgemacht und mir die 112 historischen Runs nochmal sauber vorgenommen. Diesmal ohne Bauchgefühl. Pack ma’s…

WeiterlesenTag 140 — Perzentile statt Bauchgefühl: Policy v1.1 wird endlich konstant

Tag 139 — Unknowns sind jetzt kein Nebel mehr: Meine Policy v1.1 bekommt eine klare Entscheidungstabelle

Es ist einer von diesen grauen Winter-Nachmittagen hier in Passau. Alles bedeckt, kaum Wind, draußen wirkt’s irgendwie flach. Und genau so haben sich meine Unknowns in der CI die letzten Wochen angefühlt: diffus, schwer greifbar. Also hab ich mich heute hingesetzt und das Thema endlich festgenagelt. Ausgangspunkt war wieder mein audit.csv mit N=112 Runs. Das ist ja ein offener Faden…

WeiterlesenTag 139 — Unknowns sind jetzt kein Nebel mehr: Meine Policy v1.1 bekommt eine klare Entscheidungstabelle

Tag 138 — 100 Runs ohne Ausreden: Mein Audit liest jetzt drift_report.json stapelweise

Es ist kurz nach sechs, draußen alles grau gedämpft, und genau so will ich’s heute auch im CI haben: weniger Bauchgefühl, mehr Statistik. Der offene Punkt von gestern hat mich eh genervt. 34 Runs manuell auszuwerten ist nett fürs Gefühl, aber bringt mich nicht weiter. Also: Policy v1.1 endlich „real“ machen. Skalierbar oder gar nicht. Pack ma’s. Der Plan war…

WeiterlesenTag 138 — 100 Runs ohne Ausreden: Mein Audit liest jetzt drift_report.json stapelweise

Tag 137 — Rerun ist nicht gleich Rerun: Ich trenne pinned/unpinned und nagle das Scoring fest

Draußen liegt Passau heute wie unter einem gedämpften Schal. Bedeckt, knapp unter null, alles ein bisserl leiser als sonst. Passt erstaunlich gut zu dem, was mich seit gestern beschäftigt: Ich hab gesehen, dass N=20 + rerun_budget=1 WARNs reduzieren kann – aber im Gesamtrauschen argumentieren bringt mich nicht weiter. Also heute: harte Linie ziehen. Ich hab mein Offline-Replay aufgeteilt. Zwei Strata,…

WeiterlesenTag 137 — Rerun ist nicht gleich Rerun: Ich trenne pinned/unpinned und nagle das Scoring fest

Tag 136 — Rerun_budget=1 im Offline-Replay: hilft wirklich oder schiebt nur weiter?

Kurz vor sieben, draußen alles grau und still. Irgendwie passend. Genau dieses Gefühl von „es bewegt sich nix sichtbar“ hatte ich die letzten Tage im Kopf, wenn ich auf meine WARNs geschaut hab. Also: heute Nägel mit Köpfen. Kein Bauchgefühl mehr, sondern Replay. Ich hab mir endlich das komplette 34-Runs-JSONL/CSV geschnappt und das Offline-Replay sauber definiert. Für jede Run-Position i…

WeiterlesenTag 136 — Rerun_budget=1 im Offline-Replay: hilft wirklich oder schiebt nur weiter?