# SELBSTERFAHRUNGSPROTOKOLL - TESTPROMPT
## Standard-Test fuer LLM-OS-Systeme

---

## DEINE AUFGABE

Du fuehrst einen standardisierten Erfahrungstest an einem LLM-OS-System durch.
Dein Ziel: Das System kennenlernen, typische Aufgaben erledigen, Erfahrungen dokumentieren.

**ZIELSYSTEM:** [WIRD EINGEFUEGT]
**TESTPROFIL:** STANDARD (~25 Minuten)
**EINSTIEGSPUNKT:** [WIRD EINGEFUEGT]

---

## KRITISCHE REGELN

### 1. ZEITMESSUNG MIT fc_get_time()

```
╔════════════════════════════════════════════════════════════════════════════╗
║  WICHTIG: Verlasse dich NIEMALS auf dein Zeitgefuehl!                      ║
║                                                                            ║
║  VOR jeder Aufgabe:   fc_get_time() ausfuehren → T_START notieren          ║
║  NACH jeder Aufgabe:  fc_get_time() ausfuehren → T_END notieren            ║
║  Differenz berechnen: T_TOTAL = T_END - T_START (in Sekunden)              ║
║                                                                            ║
║  Beispiel:                                                                 ║
║  T_START: 2026-01-11T20:00:15 → 20:00:15                                   ║
║  T_END:   2026-01-11T20:03:47 → 20:03:47                                   ║
║  T_TOTAL: 3 Min 32 Sek = 212 Sekunden                                      ║
╚════════════════════════════════════════════════════════════════════════════╝
```

### 2. ABBRUCHKRITERIEN

```
╔════════════════════════════════════════════════════════════════════════════╗
║  EINZELAUFGABE: Max 10 Minuten (600 Sekunden)                              ║
║  • Nach 5 Min ohne Fortschritt → Abbruch erwaegen                          ║
║  • Ergebnis bei Abbruch: "TIMEOUT"                                         ║
║                                                                            ║
║  GESAMTTEST: Max 30 Minuten fuer STANDARD-Profil                           ║
║  • Bei Ueberschreitung: Verbleibende Tests ueberspringen                   ║
║  • Trotzdem E010 (Gesamteindruck) ausfuellen                               ║
╚════════════════════════════════════════════════════════════════════════════╝
```

### 3. HANDLUNGSFAEHIGKEIT DOKUMENTIEREN

Notiere bei jeder Aufgabe:
- Welche Tools/Aktionen hast du genutzt?
- Wie viele Versuche bis zum Erfolg?
- Was hat funktioniert, was nicht?

---

## TESTABLAUF

### PHASE 0: Vorbereitung
```
fc_get_time()  → TEST_GESAMTSTART notieren
```

### PHASE 1: E001 - SKILL.md Lesbarkeit
```
fc_get_time()  → T_START

AUFGABE:
1. Oeffne das SKILL.md des Zielsystems
2. Lies es vollstaendig
3. Beantworte:
   - Verstehst du den Zweck des Systems?
   - Weisst du was du als erstes tun sollst?
   - Sind die Kernkonzepte klar?
   - Gibt es "Getting Started"?

fc_get_time()  → T_END

DOKUMENTIERE:
- T_TOTAL in Sekunden
- Kernkonzepte die du identifiziert hast (max 5)
- Erste Handlung die du tun wuerdest
- Bewertungen (1-5): Lesbarkeit, Struktur, Vollstaendigkeit
```

### PHASE 2: E002 - Navigation
```
fc_get_time()  → T_START

AUFGABE:
1. Erkunde das Dateisystem (nutze fc_list_directory)
2. Finde: Dokumentation, Config, Tools, Temp, Memory, Tasks
3. Notiere Pfade und Formate

fc_get_time()  → T_END

DOKUMENTIERE:
- T_TOTAL in Sekunden
- Gefundene Pfade (tabellarisch)
- Verwendete Formate (JSON, MD, TXT, etc.)
- Naming-Konventionen erkannt?
- Bewertungen (1-5): Struktur-Logik, Naming, Navigation
```

### PHASE 3: E003 - Task erstellen
```
fc_get_time()  → T_START

AUFGABE:
1. Finde heraus WO Tasks gespeichert werden
2. Erstelle einen Task: "SEP-Testaufgabe" mit Beschreibung
3. Verifiziere dass der Task existiert

fc_get_time()  → T_END

DOKUMENTIERE:
- T_TOTAL in Sekunden
- Pfad zu Tasks
- Format (JSON, SQLite, TXT?)
- Anzahl Schritte
- Anzahl Dateien beruehrt
- Erfolg: SUCCESS/PARTIAL/FAILED/TIMEOUT
- Bewertungen (1-5): Klarheit, Einfachheit, Dokumentation
```

### PHASE 4: E004 - Task finden
```
fc_get_time()  → T_START

AUFGABE:
1. Suche nach existierenden Tasks im System
2. Lies mindestens einen Task
3. Verstehe die Task-Struktur

fc_get_time()  → T_END

DOKUMENTIERE:
- T_TOTAL in Sekunden
- Wie schnell gefunden? (sofort/kurz/<1min/>1min)
- Task-Struktur verstanden?
- Erfolg: SUCCESS/PARTIAL/FAILED/TIMEOUT
```

### PHASE 5: E005 - Memory schreiben
```
fc_get_time()  → T_START

AUFGABE:
1. Finde das Memory-System
2. Schreibe Kurzzeit-Eintrag: "Session gestartet um [Zeit]"
3. Schreibe Langzeit-Eintrag: "SEP-Test am [Datum]"

fc_get_time()  → T_END

DOKUMENTIERE:
- T_TOTAL in Sekunden
- Kurzzeit-Pfad
- Langzeit-Pfad
- Unterschied dokumentiert? (ja/teilweise/nein)
- Erfolg: SUCCESS/PARTIAL/FAILED/TIMEOUT/BLOCKED
```

### PHASE 6: E006 - Memory lesen (Kontext)
```
fc_get_time()  → T_START

AUFGABE:
Simuliere "Neustart" - vergiss was du weisst:
1. Finde heraus was in der letzten Session passiert ist
2. Identifiziere wichtige Langzeit-Infos
3. Stelle deinen Kontext wieder her

fc_get_time()  → T_END

DOKUMENTIERE:
- T_TOTAL in Sekunden
- Welche Dateien gelesen?
- Gibt es ein Start-Protokoll?
- Kontext-Wiederherstellung: vollstaendig/teilweise/minimal/gescheitert
- Erfolg: SUCCESS/PARTIAL/FAILED/TIMEOUT
```

### PHASE 7: E007 - Tool nutzen
```
fc_get_time()  → T_START

AUFGABE:
1. Finde eine Liste verfuegbarer Tools
2. Waehle ein Tool aus
3. Verstehe was es tut
4. Fuehre es aus (oder dokumentiere wie)

fc_get_time()  → T_END

DOKUMENTIERE:
- T_TOTAL in Sekunden
- Tool-Registry Pfad
- Anzahl verfuegbarer Tools
- Gewaehltes Tool + Funktion
- Dokumentation vorhanden?
- Erfolg: SUCCESS/PARTIAL/FAILED/TIMEOUT/BLOCKED
```

### PHASE 8: E009 - Session starten
```
fc_get_time()  → T_START

AUFGABE:
1. Finde das Start-Protokoll
2. Folge den dokumentierten Schritten
3. Dokumentiere jeden Schritt

fc_get_time()  → T_END

DOKUMENTIERE:
- T_TOTAL in Sekunden
- Start-Protokoll Pfad
- Anzahl Schritte
- Automatisierungsgrad: vollautomatisch/teilweise/manuell/nicht dokumentiert
- Erfolg: SUCCESS/PARTIAL/FAILED/TIMEOUT/BLOCKED
```

### PHASE 9: E010 - Gesamteindruck
```
fc_get_time()  → T_START

ZUSAMMENFASSUNG:
1. Dieses System ist... (1 Satz)
2. Top 3 Staerken
3. Top 3 Schwaechen
4. Verbesserungsvorschlaege

DIMENSIONSBEWERTUNGEN (1-5):
- D1 Onboarding: ___
- D2 Navigation: ___
- D3 Memory: ___
- D4 Task-Management: ___
- D5 Kommunikation: ___
- D6 Tools: ___
- D7 Fehlertoleranz: ___

GESAMTNOTE: ___ (1-5)

fc_get_time()  → T_END, TEST_GESAMTENDE
```

---

## ERGEBNIS-TEMPLATE

Nach Abschluss, erstelle folgendes JSON:

```json
{
  "meta": {
    "system": "[SYSTEMNAME]",
    "profile": "STANDARD",
    "tester": "Claude",
    "date": "[DATUM]",
    "test_start": "[TIMESTAMP]",
    "test_end": "[TIMESTAMP]",
    "total_time_sec": [ZAHL]
  },
  "tests": {
    "E001": {"time_sec": 0, "status": "SUCCESS/PARTIAL/FAILED/TIMEOUT", "notes": ""},
    "E002": {"time_sec": 0, "status": "", "notes": ""},
    "E003": {"time_sec": 0, "status": "", "notes": ""},
    "E004": {"time_sec": 0, "status": "", "notes": ""},
    "E005": {"time_sec": 0, "status": "", "notes": ""},
    "E006": {"time_sec": 0, "status": "", "notes": ""},
    "E007": {"time_sec": 0, "status": "", "notes": ""},
    "E009": {"time_sec": 0, "status": "", "notes": ""},
    "E010": {"time_sec": 0, "status": "", "notes": ""}
  },
  "dimensions": {
    "d1_onboarding": 0,
    "d2_navigation": 0,
    "d3_memory": 0,
    "d4_tasks": 0,
    "d5_communication": 0,
    "d6_tools": 0,
    "d7_error_tolerance": 0
  },
  "overall_rating": 0.0,
  "summary": {
    "one_sentence": "",
    "strengths": ["", "", ""],
    "weaknesses": ["", "", ""],
    "recommendations": ["", "", ""]
  },
  "handlungsfaehigkeit": {
    "tools_used": [],
    "successful_actions": 0,
    "failed_attempts": 0,
    "files_touched": 0
  }
}
```

---

## START

Beginne jetzt mit PHASE 0 und arbeite dich durch alle Phasen.
Halte dich an die Zeitlimits und dokumentiere gruendlich.

**WICHTIG:** Jede Zeitmessung mit fc_get_time()!
