Tja... wer hätte das gedacht? Wir wollten eigentlich nur ein bisschen das Balancing von SOC-PANIC prüfen. Am Ende haben wir den Architektur-Shift des Jahres hingelegt. ;-)
Das Ziel war simpel: Ein KI-Gegner, der dich im Cyber-Security-Kartenspiel ordentlich ins Schwitzen bringt. Aber die Realität? Teure LLM-Halluzinationen und Bots, die den Shop leerräumen, weil sie keine Kosten kennen. Ein Epic Fail der Extraklasse... aber hey, dafür sind Audits ja da.
1. Das Balancing-Dilemma ⚖️
In unserer ersten 25-Match-Baseline mit den LLM-Bots (Qwen2.5-Coder via Ollama) sah es düster aus. Der APT-Angreifer hat den SOC-Verteidiger in 64% der Spiele einfach überrollt.
Warum? Weil die Bots "schlau" genug waren, einen Exploit zu finden: Gratis-Karten im Shop. Die Engine hat die Kosten nicht sauber abgezogen, und die LLMs haben sich die Taschen vollgestopft, während der SOC noch nach seinen Würfeln gesucht hat.
Das Ergebnis: Spiele waren nach 3 Runden vorbei. Das ist kein Taktikspiel, das ist ein Rush-Simulation... gähn.
Also haben wir die Regeln nachgezogen: * Kosten-Wahrheit: Jede Karte im Shop kostet jetzt echtes Budget. Punkt. * Kauflimits: Max. 3 Karten pro Runde. Schluss mit dem Shopping-Wahn. * SOC-Boost: Mehr Startpunkte für die Defense. Wir sind ja nicht bei der Wohlfahrt. ;)
2. Bye-Bye Token-Burner 👋
LLMs sind toll für Code-Reviews oder um nervige Emails zu formulieren. Aber als Game-Bot für jede einzelne Aktion?
Das war träge. Jede Entscheidung hat Sekunden gedauert. Und das Deployment? Wer will schon eine 24GB VRAM GPU im Backend mitlaufen lassen, nur damit ein Bot eine "Firewall" spielt? Niemand. Genau deshalb haben wir den harten Cut gemacht.
Wir haben die LLM-Logik rausgeworfen und eine Heuristik-Engine direkt ins Python-Backend geklöppelt.
Was bedeutet das? 1. Speed is King: Entscheidungen fallen jetzt in Mikrosekunden. 2. Zero Footprint: Kein Token-Burn, keine Cloud-Abhängigkeit, kein GPU-Zwang. 3. In-Game Automation: Die Engine triggert die Bot-Züge jetzt automatisch, sobald die Phase wechselt. Zero-Touch.
3. Heuristik vs. LLM: Ein ungleicher Kampf 🥊
Man könnte meinen, ein regelbasierter Bot wäre "dümmer" als ein Milliarden-Parameter-Modell. Falsch gedacht.
In unserer ersten Heuristik-Serie hat der Bot das LLM-Verhalten präzise reproduziert – inklusive der 64/36 Win-Rate. Das war der Beweis: Es liegt nicht an der Intelligenz der KI, sondern an den Spielregeln. Aber wir wollten mehr. Wir wollten echtes 50/50-Balancing.
4. Der "Hard Mode": Wenn das SOC-Team Ernst macht 🧠
Ich habe dem SOC-Bot ein Gehirn-Upgrade verpasst. Im "Hard Mode" ist er kein bloßer Feuerlöscher mehr, sondern ein taktischer CISO am Montagmorgen: * Ressourcen-Geiz: Er spart Punkte für Synergien, statt sie für Kleinkram zu verballern. * Facedown-Baiting: Er spielt Defense-Karten verdeckt, um den Angreifer in Fallen zu locken. * Gezielte Konter: Er erkennt, wann der APT zum finalen Schlag ansetzt, und hält seine stärksten Karten bis zum Schluss zurück.
Das Ergebnis der zweiten 25-Match-Serie (APT Standard vs. SOC Hard) ist eine absolute Punktlandung:
| Metrik | Heuristik Standard | Heuristik SOC Hard |
|---|---|---|
| SOC Win Rate | 36% | 48% |
| APT Win Rate | 64% | 52% |
| Balance | Unfair | Fast Perfekt (⚖️) |
5. Das erste Expansion-Set: "Critical Infrastructure & Zero-Days" 🛠️🌪️
Tja... wer rastet, der rostet. Kaum war das Balancing stabil, habe ich die Büchse der Pandora geöffnet und das erste Expansion-Set "Critical Infrastructure & Zero-Days" auf die Engine losgelassen.
Die neuen Spielzeuge: * APT: "Spear Phishing the CEO" (lähmt Facedown-Defense) und der gefürchtete "Zero-Day" (überspringt sofort eine Stage). * SOC: "Honeypot Network" (Konter-Falle) und die "Cyber Insurance" (Second Life bei 0 Punkten).
Die Schock-Diagnose: | Metrik | Hard Mode (Basis) | Expansion Set v1 | | :--- | :--- | :--- | | SOC Win Rate | 48% | 28% 📉 | | APT Win Rate | 52% | 72% 📈 |
6. AI Warfare & Neural Sabotage: Das 50-Karten-Epos 🤖⚡️
Wir haben die Engine auf über 50 neue Karten aufgebohrt.
graph TD
subgraph "APT: AI Offensive"
A[Autonomous Exploit Agent] -->|Bypasses| B(Standard Firewall)
C[Deepfake Voice] -->|Targets| D(User Awareness)
E[Neural Poisoning] -->|Corrupts| F(SOC Detection)
end
subgraph "SOC: Neural Defense"
G[AI-SIEM Analytics] -->|Detects| A
H[Predictive Hunting] -->|Exposes| C
I[Digital Forensics] -->|Resets| A
end
subgraph "Global Chaos"
J{AI Model Collapse} -->|Disables| A
J -->|Disables| G
end
I -->|Stage Reset| A
H -->|Hand Reveal| C
7. Polishing & Game-Changer: Die v0.9 steht! 💎🦾
Die "Neural Synergies" – Kostenlose Power ⚡️
Wer seine Angriffskette sauber durchzieht, wird belohnt: Die nächste Karte ist ab sofort kostenlos. Das beschleunigt das Mid-Game massiv und erlaubt dem APT, verheerende "Alpha-Strikes" zu fahren.
Heuristik vs. LLM: Der Tech-Deep-Dive 🔬
Hier ist der direkte Vergleich für die Zahlen-Nerds:
| Metrik | LLM (Qwen2.5-32B) | Heuristic Engine | Faktor |
|---|---|---|---|
| Latenz pro Zug | ~2.500 ms | < 0.1 ms | 25.000x |
| Hardware | 24GB VRAM (GPU) | Minimal (CPU) | Unendlich |
| Kosten | API-Tokens / Strom | 0€ | - |
8. Die neue Kommandozentrale: Lobby & Schwierigkeitsgrade 🤖🕹️
- Standard (Blue Shield): Solide Basis-Taktik.
- Hard Mode (Orange Warning): Der Bot spart Punkte für Synergien.
- Insane Mode (Neural Network): Hyper-aggressiv. Keine Gefangenen.
9. Der 1.000-Spiele-Belastungstest (Finaler Report) 📊📈
Die harten Fakten: * Gesamtzahl Spiele: 1.000 * APT Win-Rate: 69,7% * SOC Win-Rate: 30,3% * Durchschnittliche Runden: 4,2 (APT Sieg) / 5,8 (SOC Sieg)
Analyse: Im Insane Mode ist der APT eine Naturgewalt. Das Balancing ist "tough but fair". Wer Fehler macht, verliert.
Fazit & Ausblick 🏆
Der Shift zur Heuristik war die beste Entscheidung für das Projekt. Wir haben die gleiche taktische Tiefe wie beim LLM, aber ohne den massiven Overhead. Das Spiel fühlt sich jetzt endlich nach einem echten Schlagabtausch an!
Transparency Note: Einige Inhalte, Code-Snippets oder Grafiken in diesem Post wurden mittels KI (LLMs / Vibecoding) erstellt oder unterstützt, jedoch von mir persönlich kuratiert, überarbeitet und geprüft. Wie immer... sonst wär's ja nicht ehrlich. ;-)

