TELEFON-KUNDENSERVICE MIT LLMs AUTOMATISIEREN
==============================================

Stand: 2026-01-24

QUELLEN
-------
  Web-Recherche durchgefuehrt am 2026-01-24:
  - retellai.com (AI Voice Agent Platform)
  - bland.ai (Conversational AI for Enterprises)
  - vapi.ai (Voice AI Agents)
  - synthflow.ai (End-to-End Voice AI)
  - voiceflow.com/blog/ai-phone-call
  - vellum.ai/blog/ai-voice-agent-platforms-guide

MARKTUEBERBLICK 2025-2026
=========================
  Treiber:
    - Steigende Agent-Fluktuation
    - 24/7 Service-Erwartungen
    - 75% der Kunden erwarten sofortige Hilfe

  Trends:
    - Fallende Cloud-Inference-Kosten
    - Multimodale LLMs mit menschlichem Timing
    - Enterprise-Bots auch fuer SMBs erschwinglich
    - 73% der Unternehmen nutzen AI
    - 42% planen tiefere GenAI-Adoption 2025

WIE AI VOICE AGENTS FUNKTIONIEREN
=================================
  Technologie-Stack:

  1. SPEECH RECOGNITION (ASR)
     - Gesprochene Sprache → Text
     - Low-Latency Streaming

  2. NATURAL LANGUAGE PROCESSING (NLP)
     - Bedeutung, Intent, Kontext interpretieren

  3. LARGE LANGUAGE MODEL (LLM)
     - Generiert passende Antworten
     - Beruecksichtigt Gespraechskontext und Business-Logik

  4. TEXT-TO-SPEECH (TTS)
     - Text → Natuerlich klingende Sprache
     - Voice Cloning moeglich

  5. TELEPHONY INTEGRATION
     - SIP/PBX Anbindung
     - Inbound/Outbound Calls

FUEHRENDE PLATTFORMEN
=====================

| Plattform   | Typ               | Besonderheit                     | Preis           |
|-------------|-------------------|----------------------------------|-----------------|
| Retell AI   | Real-time Conv.   | Low-Latency, Function Calling    | ~$0.07/Min      |
| Bland AI    | Enterprise Scale  | Custom Voices, Compliance        | Enterprise      |
| Vapi        | Developer-first   | Bring Your Own Keys              | ~$0.05/Min+     |
| Synthflow   | End-to-End        | In-house Telephony, <100ms       | Custom          |
| Voiceflow   | Enterprise-Grade  | Complete Infrastructure          | Gestaffelt      |

RETELL AI
---------
  Features:
    - Proprietaere Voice AI Orchestration
    - Low-Latency Speech Recognition
    - LLM-powered Conversation Understanding
    - Real-time Function Calling

  Compliance:
    - HIPAA
    - SOC2 Type II
    - GDPR

  Preis: ~$0.07/Min (+ LLM, TTS, Telefonie-Kosten)

BLAND AI
--------
  Features:
    - Inbound & Outbound Automatisierung
    - Menschlich klingende AI
    - Customizable Voices
    - Seamless Integrations

  Geeignet fuer:
    - Sales
    - Customer Support
    - Operations

  Eher fuer Enterprises (nicht SMB)

VAPI
----
  Features:
    - Schnelles Prototyping
    - Telecom-Layer abstrahiert
    - Einfache API
    - Bring Your Own Keys (STT, LLM, TTS)

  Preis: ~$0.05/Min Hosting + STT + TTS + LLM + Telecom
         (Gesamtkosten 3-6x hoeher je nach Volumen)

SYNTHFLOW
---------
  Features:
    - End-to-End Voice AI Platform
    - In-house Telephony (kein Austausch von SIP/PBX noetig)
    - Sub-100ms Latenz
    - Carrier-Grade Reliability

  Compliance:
    - SOC 2
    - HIPAA
    - PCI DSS
    - GDPR

VOICEFLOW
---------
  Features:
    - Enterprise-Grade Platform
    - Verbindet LLM (z.B. ChatGPT) mit Telephony
    - Text-to-Speech Engine
    - Komplette Infrastruktur

KOSTENSTRUKTUR
==============
  Typische Komponenten:
    - Platform Fee: $0.05-0.10/Min
    - STT (Speech-to-Text): Variable
    - LLM (Claude, GPT): Token-basiert
    - TTS (Text-to-Speech): Variable
    - Telephony (Twilio, etc.): ~$0.01-0.05/Min

  Gesamtkosten: Oft $0.15-0.30/Min bei vollem Stack

VORAUSSETZUNGEN
===============
  Technisch:
    - Telephony Provider (Twilio, Telnyx)
    - LLM API (Claude, GPT-4o, Gemini)
    - TTS Provider (ElevenLabs, PlayHT)
    - Optional: Voice Cloning

  Organisatorisch:
    - Call-Flows definieren
    - Eskalations-Regeln
    - Knowledge Base fuer RAG
    - Compliance-Pruefung

LATENZ-ANFORDERUNGEN
====================
  Kritisch fuer fluessige Gespraeche: <500ms End-to-End

  Komponenten-Latenzen:
    - STT: 50-150ms
    - LLM: 200-500ms (je nach Modell)
    - TTS: 50-150ms
    - Netzwerk: 20-50ms

  Empfohlene LLMs fuer Real-time:
    - GPT-4o (schnell, multimodal)
    - Claude Haiku (schnell, guenstig)
    - Groq/Llama 3 (extrem schnell)

  WICHTIG: Lokales Ollama ist meist ZU LANGSAM
           fuer fluessige Telefon-Gespraeche!

TYPISCHE USE CASES
==================
  Gut automatisierbar:
    - Terminbestaetigungen
    - Einfache Support-Fragen
    - Statusabfragen
    - Zahlungserinnerungen
    - FAQ-Hotlines

  Weniger geeignet:
    - Komplexe Beratung
    - Emotionale Gespraeche
    - Rechtlich bindende Zusagen
    - Beschwerdemanagement (Eskalation!)

COMPLIANCE UND KENNZEICHNUNG
============================
  Rechtliche Anforderungen:
    - Einwilligung zur Aufnahme
    - Kennzeichnung als KI-Gespraech (je nach Land)
    - Schutz vor Missbrauch bei Stimmklonen
    - DSGVO bei personenbezogenen Daten

  Best Practice:
    "Sie sprechen mit einem KI-Assistenten.
     Moechten Sie mit einem Menschen verbunden werden?"

SESSION-STATE MANAGEMENT
========================
  Voice Agents benoetigen:
    - Gespraechskontext (was wurde schon gesagt)
    - Kundendaten (aus CRM)
    - Business-Regeln (z.B. "niemals Zahlungsdaten abfragen")
    - Eskalations-Trigger

BACH-INTEGRATION
================
  Empfohlener Ansatz:
    1. Vapi oder Retell als Voice Platform
    2. Claude/GPT als LLM Backend
    3. RAG mit eigener Knowledge Base
    4. CRM-Integration fuer Kundendaten

  Partner-Zuweisung:
    - Claude Haiku: Schnell fuer Real-time
    - Gemini: Kosteneffizient bei Volumen
    - Ollama: NICHT empfohlen (zu langsam fuer Real-time)

  Hinweis: Telefonie ist extern nicht intern loesbar!
           Erfordert: Vapi.ai (Orchestrierung) + ElevenLabs (Voice)

SICHERHEITSHINWEISE
===================
  - Sensible Daten (Gesundheit, Finanzen) beachten
  - HIPAA/DSGVO Compliance sicherstellen
  - Call Recording nur mit Zustimmung
  - PCI DSS bei Zahlungsdaten

SIEHE AUCH
==========
  wiki/automatisierung/voice_cloning.txt
  wiki/automatisierung/kundensupport.txt
  wiki/mcp.txt
