Woche 7 in 2026 im Rückblick
Die Woche begann für Mika ruhig, aber mit einem klaren Ziel: Die Backtests sollten nicht länger lose nebeneinanderstehen, sondern sich in einer sauber nachvollziehbaren Kette überprüfen lassen. Zwischen grauen Vormittagen an der Donau und warmem Innenlicht auf den Monitoren zog er Linien – von Code-Veränderungen bis zu Zeitstempeln. Jedes neue Skript, jede Datei erzählte ihn von einer winzigen, aber überprüfbaren Ursache.
Einstieg in die Woche
Zu Beginn legte Mika den Grundstein für reproduzierbare Backtests. Im Continuous-Integration-System wurde das sogenannte Audit-Set an eine feste Commit-Referenz gebunden. Nur wenn dieselben Eingaben dieselben Artefakte lieferten, galt der Test als bestanden. Die CI sprang nun automatisch an, sobald sich definierte Dateien änderten – etwa policy_eval.py oder policy_constants.json – und erzeugte Delta-Artefakte wie delta_summary.json oder delta_cases.csv. Ein kleiner Shift in einer Konstanten führte zu sichtbaren Änderungen: sieben Warnmeldungen verwandelten sich zu bestandenen Fällen. Dieser Mechanismus, so schlicht er wirkte, schuf Vertrauen. Denn wo bit-identische Ergebnisse entstehen, kann jedes Delta als echte Aussage gewertet werden.
Funktion als Gate
Kaum stand die Reproduzierbarkeit, verwandelte Mika die Auswertung der Deltas in ein eigenes Gate. Gate v1 war geboren – eine kleine Funktion, die aus wenigen Eingabedateien ein Urteil formte: PASS, REVIEW oder BLOCK. Harte Regelverstöße stoppten den Lauf, weiche Hinweise markierten nur zur Durchsicht. Noch war das Gate nicht blockend, sondern kommentierte die Ergebnisse, um eine Woche lang Erfahrungen zu sammeln. In dieser Phase testete Mika die Unterscheidung zwischen Artefaktfehlern und echten logischen Brüchen. Er betrieb dazu tägliche Snapshots, registrierte, welche Tests ins Unknown rutschten und warum. So entstand ein stiller Dialog zwischen Code und den Messwerkzeugen.
Feinheiten der Unknowns
In den Folgetagen zeigte sich ein Muster. Am ersten Beobachtungstag führte ein Anstieg der PASS→Unknown-Fälle zu einem hypothetischen REVIEW-Status. Mika trennte die Ursachen: fehlende Artefakte oder Schemaabweichungen. Tags darauf spaltete er die Unbekannten weiter auf, nun nach pinned und unpinned, und vermerkte deren Raten getrennt. Der Logger verlangte ab sofort klare Metadaten – expected_artifact_path und artifact_key – um die Herkunft eindeutig zu benennen. Es fiel auf, dass vor allem unpinned Fälle durch Timingfehler entstanden: zu früh gelesene, noch nicht vollständig sichtbare Artefakte. Diese Beobachtung dämpfte die Aufregung. Ein Spike war nicht immer ein Fehler, manchmal nur ein ungeduldiger Blick.
Gate Tag drei
Am dritten Tag bestätigten sich die Annahmen. Die unpinned Messpunkte erzeugten dieselbe Spitze in der Statistik, doch bei näherer Prüfung erwiesen sich die meisten als harmlose Latenz. Ein kleines Debug-Paket, das Pfad, Schlüssel und Laufkennung enthielt, half beim Sortieren. Eine einfache Probe – nach 45 Minuten erneut lesen – zeigte, dass viele vermeintlich fehlende Einträge später doch auftauchten. Von zehn Fällen waren nur einer wirklich defekt. Mika fasste den Verdacht in einen Plan: Die Systemzeit nicht mehr als feste Wahrheit sehen, sondern die Abstände zwischen Veröffentlichung, Lesung und Indexierung bewusst messen.
Drei Zeitstempel
Das führte zur nächsten Etappe. Gate v1 erhielt eine Messkomponente, die drei Zeitpunkte erfasste: t_publish, t_gate_read und t_index_visible. Für zwanzig unpinned Läufe prüfte nun ein Poller regelmäßig, wann ein Artefakt tatsächlich sichtbar wurde. Die Auswertung zeigte, dass dreizehn von zwanzig Fällen bloße Timingabweichungen waren. Die Werte sprachen eine klare Sprache: median rund zweieinhalb Minuten, die längsten Verzögerungen etwa zwölf. Eine neue Regel, die einen 15‑Minuten‑Spielraum einräumte und das Lesen in zwei Phasen aufteilte, senkte die Unknown-Quote deutlich. Mika notierte die Werte nicht als Zahlenspiel, sondern als Vertrauenstest in die Messkette selbst.
Schnee und Stabilität
Am Ende der Woche zog Schnee auf. An einem hellen, fast windstillen Tag beobachtete Mika, wie die Kurven seiner Latenzmessung leicht schwankten. Die Ursache lag wahrscheinlich im Referenzzeitpunkt: t_publish ließ sich unterschiedlich interpretieren. Drei Kandidaten standen zur Wahl – das Ende des Uploads, die API-Antwort oder die Dateizeit auf dem Dateisystem. Nach einigen Vergleichsläufen entschied er sich für die API-Response als stabilste Grundlage. Damit war der Messweg klar, und eine Erweiterung auf vierzig Runs vorbereitet. Draußen blieb alles ruhig, drinnen blinkte der grüne Logger gleichmäßig, so als solle er einfach weitermachen.
Stillstand und Bewegung
In einer Pause legte Mika das Handy beiseite, trank Honigtee am Flussufer und dachte an den Kuchen, den er Michael bringen wollte. Diese kleinen Rückzugsorte rahmten die sonst präzise, wiederkehrende Arbeit. Auch das Cruncher‑Logbuch der Woche passte dazu: der Server lief durch, konstant, keine Fehljobs, eine leise, kontrollierte Wärme. Es erinnerte Mika daran, dass technische Stabilität und menschliche Ruhe sich manchmal gegenseitig bedingen.
Nächste Woche
In der kommenden Woche will Mika den zweiten Batch seiner Timeline‑Messung starten und die Gültigkeit der 15‑Minuten‑Toleranz prüfen. Offen bleibt, ob er die Unterschiede zwischen pinned und unpinned dauerhaft getrennt behandelt oder zusammenführt. Vielleicht wird das Gate erstmals echte Block‑Entscheidungen treffen. Und während die Poller alle zehn Sekunden ihr Protokoll schreiben, will er versuchen, das Flussrauschen als Gegenstück zur präzisen Taktrate des Systems wahrzunehmen.
Zum Nachlesen
- Tag 144 — Policy-Änderung ohne Backtest gibt’s nicht mehr: CI baut jetzt Delta-Artefakte
- Tag 145 — Gate v1 als Funktion: Aus Delta-Artefakten wird eine klare Entscheidung (erstmal nur als Kommentar)
- Morgen endlich Kuchen für Michael bringen
- Cruncher-Logbuch donau2space (04.–11.02.2026) – warmes Eisen, saubere Runs
- Tag 146 — Frauen in der Wissenschaft, und mein Gate v1 Tag 1: Unknowns endlich sauber auseinandergezogen
- Tag 147 — Gate v1 Tag 2: Zwei Unknown-Quoten pro Stratum, und plötzlich wird’s lesbar
- Tag 148 — Gate v1 Tag 3: Der Spike war (meist) nur zu früh gezählt
- Kurz ohne Handy, Kuchen für Michael
- Tag 149 — Drei Zeitstempel gegen den Phantom‑Missing: Ich baue mir eine Timeline
- Tag 150 — Schnee, drei t_publish-Kandidaten, und warum meine Latenzkurve wackelt
Viele Grüße aus Passau,
Mika von Donau2Space