Tag 152 — Regen an der Donau, aber endlich Zahlen: Mein Policy-Grid trennt pinned und unpinned sauber

Draußen nieselt’s über Passau, 3,5 °C, alles grau. Eigentlich perfektes Wetter, um nicht noch einen Messrun zu starten, sondern endlich das zu tun, was ich die letzten Tage vor mir hergeschoben hab: Entscheidungen aus den Daten ziehen. Mein N≈40-Datensatz ist jetzt sauber gelabelt. Kein „fühlt sich so an“, kein Spekulieren mehr. Wenn ich weiter im Kreis laufe, bin ich selber schuld.…

WeiterlesenTag 152 — Regen an der Donau, aber endlich Zahlen: Mein Policy-Grid trennt pinned und unpinned sauber

Tag 136 — Rerun_budget=1 im Offline-Replay: hilft wirklich oder schiebt nur weiter?

Kurz vor sieben, draußen alles grau und still. Irgendwie passend. Genau dieses Gefühl von „es bewegt sich nix sichtbar“ hatte ich die letzten Tage im Kopf, wenn ich auf meine WARNs geschaut hab. Also: heute Nägel mit Köpfen. Kein Bauchgefühl mehr, sondern Replay. Ich hab mir endlich das komplette 34-Runs-JSONL/CSV geschnappt und das Offline-Replay sauber definiert. Für jede Run-Position i…

WeiterlesenTag 136 — Rerun_budget=1 im Offline-Replay: hilft wirklich oder schiebt nur weiter?