# Portabilitaet: UNIVERSAL
# Zuletzt validiert: 2026-01-28 (Gemini)
# Naechste Pruefung: 2027-01-28
# Quellen: [skills/_protocols/ing-strategie.md]

ING STRATEGIE & MULTI-MODELL ARCHITEKTUR
========================================

Stand: 2026-01-28

DAS KONZEPT: SPEZIALISIERUNG STATT "ONE SIZE FITS ALL"
------------------------------------------------------
Frueher nutzte man ein "smartes" Modell (z.B. GPT-4) fuer alles. Das ist teuer und langsam.
Die Ing-Strategie (Ingenieur-Strategie) setzt auf ein Team von spezialisierten Modellen, die wie eine Abteilung in einer Firma organisiert sind.

DIE ROLLENVERTEILUNG (DIE PYRAMIDE)
-----------------------------------

### Level 3: OPUS / GPT-4o (Der Architekt)
- **Rolle:** CTO, Senior Architect.
- **Aufgaben:** Strategie, komplexe Designs, Fehleranalyse bei Blockern, Architektur-Entscheidungen.
- **Kosten:** Hoch ($$$).
- **Motto:** "Denk nach, bevor wir bauen."

### Level 2: SONNET / GPT-4o-mini (Der Senior Dev)
- **Rolle:** Erfahrener Entwickler.
- **Aufgaben:** Implementierung von Klassen, Refactoring, Unit-Tests schreiben, Debugging.
- **Kosten:** Mittel ($$).
- **Motto:** "Get shit done."

### Level 1: HAIKU / FLASH (Der Junior / Praktikant)
- **Rolle:** Assistent.
- **Aufgaben:** Boilerplate-Code, Formatierung, Listen sortieren, einfache Skripte, Log-Analyse.
- **Kosten:** Niedrig ($).
- **Motto:** "Schnell und schmutzig."

### Level 0: OLLAMA (Localhost)
- **Rolle:** Das lokale Tool.
- **Aufgaben:** Text-Zusammenfassungen, Privacy-kritische Daten, Offline-Tasks.
- **Kosten:** Null (nur Strom).

DER SCORE-ALGORITHMUS
---------------------
Um zu entscheiden, wer was macht, nutzen wir einen heuristischen Score (0-50):
`SCORE = (10 - KLARHEIT) + KOMPLEXITÄT + KREATIVITÄT + KONTEXT + KRITIKALITÄT`

- **< 12 (Low):** Haiku/Ollama. (Z.B. "Erstelle __init__.py")
- **13-28 (Mid):** Sonnet. (Z.B. "Refactore Widget X")
- **> 29 (High):** Opus. (Z.B. "Entwirf neue System-Architektur")

KOSTEN-EFFIZIENZ
----------------
Durch dieses Routing ("Opus denkt, Sonnet baut, Haiku tippt") koennen Token-Kosten um bis zu 60-80% gesenkt werden, bei gleichbleibender Qualitaet der Architektur.

SIEHE AUCH
----------
wiki/gemini.txt                    Gemini Modelle
skills/_protocols/ing-strategie.md      Workflow und Matrix
