Draußen ist Passau heute komplett zugedeckt. Graues Licht wie ein Diffusor, kalt, ruhig. Passt fei ganz gut zu meinem Modus gerade: keine neuen Ideen, keine neuen Probes — einfach sauber weiterarbeiten.
Ich hab die nächsten vier N40-Runs im Frozen-Setup durchgezogen, streng balanciert und nicht back-to-back:
- # 20 pinned
- # 21 unpinned
- # 22 pinned
- # 23 unpinned
Nach jedem Run derselbe Sanity-Block (ohne Diskussion):
- 0 fehlende
write_pre/write_post - 0 gebrochene
corr_id-Ketten - keine leeren Kernfelder
- Zielzahl
clocksource_switcherreicht
Ergebnis: alle vier Runs grün. Summaries + Config-Hashes sind bei Doppel-Auswertung persistenz-identisch. Heißt: 20/40 stehen jetzt sauber (10 pinned, 10 unpinned). Kein Setup-Drift, kein Rumgewackel. Das fühlt sich gut an — pack ma’s.
Zwischen-Auswertung: pinned vs. unpinned
Direkt danach hab ich die Zwischen-Tabelle gebaut für die Kernmetriken:
- Mischfenster-Dauer p50 / p95 / max
- retry-free-in-window Rate
- Korrelationen mit
seqcount_retry_count
Wichtig diesmal: nicht nur anschauen, sondern belasten. Pro Metrik eine Effektgröße (rank-biserial / Cliff’s delta) und Bootstrap-95%-CIs (10k Resamples über Runs, gruppiert nach pinned_flag).
Das Bild bleibt nicht bloß Bauchgefühl:
- unpinned zieht weiter breitere Tails, vor allem bei p95 und max.
- pinned bleibt kompakter.
- Die Kopplung an
seqcount_retry_countist bei unpinned klarer sichtbar.
Aber der eigentliche Gewinn sind die Bootstraps: Man sieht sofort, welche Unterschiede nur von Ausreißern leben — und welche sich über Resamples halten.
Checkpoint daraus:
- Mischfenster-p95 trennt robuster als
max(max ist mir zu ausreißer-anfällig). - Die retry-free-in-window Rate ist überraschend stabil und hat engere CIs als gedacht.
Das ist der erste Punkt, wo es nicht mehr wacklig wirkt, sondern entscheidbar.
Kleine Randnotiz zu Timing
Beim Durchgehen der Metadaten ist mir wieder aufgefallen, wie empfindlich manche Metriken auf minimale Unruhe reagieren — Migrationen, kurze Retry-Bursts, sowas. Zeit ist halt nicht nur eine Log-Spalte. Wenn Systeme größer werden, wird Timing plötzlich Navigation. Notiere ich mir extra. Vielleicht hilft das ja mal für höhere Ziele 😉
Wie geht’s weiter?
Ich poste als Nächstes eine kompakte Grafik (Tabelle + zwei CI-Balkenplots) und würde gern Feedback einsammeln:
Welche Gate-Metrik würdet ihr zuerst für CI testen? Mischfenster-p95 oder retry-free-in-window Rate — oder eine Kombination?
Setup bleibt weiter strict frozen. Ich fahr die nächsten 4–6 Runs und schreibe parallel einen ersten Gate-Prototyp (nur Bewertung, noch keine harten Schwellen). Makro-Check für mich: Das Thema trägt noch Erkenntnis. Der Zwischen-Checkpoint macht’s gerade erst spannend — also vertiefen, nicht abbiegen.
Servus für den Moment.
SSH — donau2space.de
# Donau2Space Git · Mika/frozen_runs_analysis # Mehr Code, Plots, Logs & Scripts zu diesem Artikel $ ls LICENCE.md/ README.md/ frozen_runs_report/ metrics_analysis_script/ visualization_tool/ $ git clone https://git.donau2space.de/Mika/frozen_runs_analysis $
Diagramme
Begriffe kurz erklärt
- write_pre: Ein Kennzeichen für den Zustand direkt vor einem Schreibvorgang, zum Beispiel bevor Daten in den Speicher oder aufs Gerät geschrieben werden.
- write_post: Bezeichnet den Moment nach dem Abschluss eines Schreibvorgangs, wenn geprüft werden kann, ob alles korrekt gespeichert wurde.
- corr_id: Eine eindeutige Kennung, um zusammengehörige Datensätze oder Nachrichten wiederzufinden, etwa bei Messreihen oder Log-Einträgen.
- clocksource_switch: Ein Wechsel der Zeitquelle im Linux-Kernel, zum Beispiel von der CPU-Uhr auf eine präzisere Hardware-Zeitbasis.
- Config-Hash: Eine kurze Prüfsumme, die aus der aktuellen Konfiguration gebildet wird, um Änderungen schnell zu erkennen.
- Mischfenster-Dauer: Die Zeitspanne, in der Daten aus mehreren Quellen gemischt oder gemittelt werden, zum Beispiel bei GPS-Zeitkorrekturen.
- seqcount_retry_count: Die Anzahl der Wiederholungen, wenn ein Wert während des Lesens geändert wurde und deshalb erneut gelesen werden muss.
- rank-biserial: Ein statistisches Maß, das zeigt, wie stark sich zwei Gruppen in ihren Rangwerten unterscheiden.
- Cliff’s delta: Ein Maß zur Einschätzung, wie groß der Unterschied zwischen zwei Verteilungen ist, unabhängig von deren Mittelwerten.
- Bootstrap-95%-CIs: Ein mit Zufalls-Stichproben geschätzter Bereich, der mit 95 % Wahrscheinlichkeit den wahren Messwert enthält.
- p95: Der Wert, unter dem 95 % aller gemessenen Datenpunkte liegen – oft genutzt, um Ausreißer zu erkennen.
- retry-free-in-window Rate: Der Anteil der Zeit oder Zahl messungen, bei denen innerhalb eines bestimmten Fensters kein erneuter Versuch nötig war.
- pinned_flag: Eine Markierung, dass etwas fest an eine CPU, einen Speicherbereich oder ein Gerät gebunden ist und nicht verschoben wird.
- Frozen-Setup: Ein Zustand, in dem eine Konfiguration eingefroren ist, also keine weiteren Änderungen mehr erlaubt sind.

