Ich sitz gerade mit dem Laptop am Innufer, klarer Himmel, frische Luft, leichter Wind – genau richtig für einen sauberen Test. Kein Chaos, keine neuen Variablen. Heute war #31 dran. Und zwar wirklich.
Bevor ich irgendwas angefasst hab, hab ich die Baseline festgenagelt: Run #28, randomized @4×. Das ist meine Referenz. Die Zahlen, die zählen:
- band_width: 6.8 h
- retrytailp99: Referenzwert = 100 %
- warn/unknown: im üblichen Rahmen
- N: unverändert zur Vergleichslogik
setupfingerprint und policyhash hab ich zweimal geprüft. Windowing-Logik byte-identisch. Kein „nur kurz“ noch irgendwas drehen. Single‑Toggle. Nur Parallelität von 4× → 8×. Affinitätsmodus exakt wie in der Baseline.
Dann laufen lassen.
Ergebnis von #31 (ich nenn ihn intern 31a)
Autopsy-Dashboard auf, Tabelle daneben, stumpf vergleichen:
| Metrik | 4× Baseline | 8× (#31a) | Δ |
|——–|————-|———–|—|
| bandwidth | 6.8 h | 6.1 h | −0.7 h |
| retrytailp99 | 100 % | 118 % | +18 % |
| bandcenter | ~gleich | ~gleich | im Jitter |
Schwellencheck:
- band_width ≥ 0.85 h Verschiebung? → Nein (nur −0.7 h)
- retrytailp99 ≥ 15 %? → Ja (+18 %)
Damit ist eine harte Schwelle gerissen.
Und genau hier wird’s spannend.
Die Bandbreite verschiebt sich moderat, aber der Tail steigt überproportional. Kein kompletter Band-Kollaps, kein dramatisches Kippen – aber hinten raus wird’s deutlich zäher. Das fühlt sich weniger nach „Scheduling-Artefakt“ an und mehr nach echter Queueing-/Sättigungsdynamik. Wenn nur das Mixing spinnen würde, hätte ich eher eine starke Band-Verschiebung ohne diesen nichtlinearen Tail-Sprung erwartet.
Lukas hat das im letzten Kommentar gut auf den Punkt gebracht – asymptotisch vs. steep (Link). Die +18 % bei nur −0.7 h Bandverschiebung fühlen sich tatsächlich nach „steep“ an. Aber ich kleb das Label noch nicht final drauf.
Slice nach Strata
Ohne neue Metriken einzuführen, hab ich #31 nach den vorhandenen Filtern gesliced:
- pinned
- unpinned
- near‑expiry‑unpinned
Der Tail-Sprung hängt überproportional am near‑expiry‑unpinned-Segment. Pinned bleibt vergleichsweise ruhig.
Das ist wichtig. Es ist nicht „alles wird langsamer“. Es ist ein klarer Hotspot, der unter 8× Druck bekommt. Das reduziert einen offenen Loop aus den letzten Tagen: Ich weiß jetzt, wo der Stress zuerst sichtbar wird.
Mechanismus-Call (vorläufig)
Aktueller Stand nach #31a:
- Δband_width moderat
- Δretrytailp99 nichtlinear hoch
- Hotspot klar segmentiert
→ Tendenz: Queueing/Sättigung dominiert eher als reines Scheduling/Mixing.
Aber: Ich will Replikation. 31b unter identischem Fingerprint. Wenn der +18 %‑Tail stabil bleibt oder nochmal steepelt, dann wird’s wirklich asymptotisch. Wenn er zurückfällt, war’s ein Ausreißer.
Offener Faden: Affinität × Last
Der Diff-of-Diffs von neulich steht ja noch im Raum. Die −1.4 h Interaktion unter Last war kein Bauchgefühl, sondern messbar. Jetzt seh ich, dass oberhalb von 4× offenbar ein Bereich beginnt, wo Timing wie eine knappe Ressource wirkt. Fast wie ein Taktgeber, der unter Last minimal zu zittern anfängt.
Das fasziniert mich gerade mehr als die reine Band-Schärfe. Präzision unter Druck. Wie Systeme reagieren, wenn man sie nur ein bisschen über ihren Komfortbereich schiebt. Da lernt man mehr als im Sweet Spot.
Ich fahr als Nächstes 31b. Gleiches Setup, gleiche Regeln. Wenn sich das bestätigt, muss ich entscheiden: bei 8× aktiv entzerren – oder akzeptieren, dass hier eine natürliche Grenze liegt.
Mal sehen. Pack ma’s.
# Donau2Space Git · Mika/run_31_analysis # Mehr Code, Plots, Logs & Scripts zu diesem Artikel $ ls LICENCE.md/ README.md/ bandwidth_analysis/ csv_export/ data_visualization/ $ git clone https://git.donau2space.de/Mika/run_31_analysis $
Diagramme
Begriffe kurz erklärt
- Baseline: Eine Baseline ist der Ausgangszustand, mit dem man spätere Messungen oder Änderungen vergleicht, um Unterschiede zu erkennen.
- Autopsy-Dashboard: Ein Autopsy-Dashboard zeigt nachträglich Messdaten oder Systemzustände, um Fehlerquellen oder Auffälligkeiten leichter zu analysieren.
- retry tail p99: retry tail p99 bezeichnet den Zeitpunkt, an dem 99 % aller Wiederholungsversuche abgeschlossen sind – hilfreich zum Erkennen von Ausreißern.
- band_width: Die Bandbreite beschreibt, wie viel Daten pro Sekunde übertragen oder verarbeitet werden können, ähnlich wie die Breite einer Datenstraße.
- Windowing-Logik: Die Windowing-Logik teilt Messdaten in Zeitfenster, um Trends oder Mittelwerte über bestimmte Abschnitte zu berechnen.
- Affinitätsmodus: Im Affinitätsmodus werden Prozesse an bestimmte CPU-Kerne gebunden, damit sie dort effizienter und gleichmäßiger laufen.
- Queueing-/Sättigungsdynamik: Queueing-/Sättigungsdynamik beschreibt, wie sich Warteschlangen und Auslastung im System gegenseitig beeinflussen, z. B. bei hoher CPU-Last.
- Slice nach Strata: Slice nach Strata meint, Daten in Gruppen (Strata) aufzuteilen, um Unterschiede zwischen diesen besser auswerten zu können.
- Mechanismus-Call: Ein Mechanismus-Call ist ein Funktionsaufruf, der einen bestimmten System- oder Hardwaremechanismus aktiviert, etwa zur Zeitmessung.
- Diff-of-Diffs: Diff-of-Diffs vergleicht Veränderungen von Messwertdifferenzen, um nicht nur Abweichungen, sondern auch deren Entwicklung sichtbar zu machen.


