TELEFONANRUFE MIT EIGENER STIMME (VOICE CLONING)
=================================================

Stand: 2026-01-24

QUELLEN
-------
  Web-Recherche durchgefuehrt am 2026-01-24:
  - elevenlabs.io/voice-cloning
  - resemble.ai/voice-cloning
  - kukarella.com/resources/ai-voice-cloning
  - callin.io/elevenlabs
  - xray.tech/post/ai-voice-clone-elevenlabs

GRUNDPRINZIP
============
  Voice Cloning erstellt eine digitale Kopie deiner Stimme:
    - Klingt genau wie du
    - Kann Text sprechen, den du nie gesagt hast
    - Fuer automatisierte Anrufe nutzbar

FUEHRENDE ANBIETER
==================

| Anbieter     | Typ              | Staerke                          | Preis           |
|--------------|------------------|----------------------------------|-----------------|
| ElevenLabs   | Consumer/Pro     | Schnell, hohe Qualitaet          | Credit-basiert  |
| Resemble AI  | Enterprise       | Fine-tuning, On-Premise          | Custom          |
| PlayHT       | Universal        | 140+ Sprachen                    | Ab $9/Mo        |
| Murf AI      | Business         | Studio, Collaboration            | Ab $19/Mo       |
| Speechify    | Consumer         | Einfache Nutzung                 | Free / Paid     |

ELEVENLABS
==========
  Features:
    - Instant Voice Cloning (wenige Sekunden Audio)
    - Professional Voice Cloning (30+ Min Audio)
    - Low-Latency Streaming
    - Twilio Integration fuer Telefonie

  Anforderungen:
    - Instant: 1-5 Minuten Audio
    - Professional: 30+ Minuten sauberes Audio
    - Qualitaet = Qualitaet des Inputs

  Telefonie-Integration:
    - ElevenLabs liefert NUR die Stimme
    - Du brauchst zusaetzlich:
      * LLM (Claude, GPT)
      * Speech Recognition
      * Call Management Logik
      * Telephony (Twilio)

  Ergebnisse:
    - Callin.io: 35% mehr Kundenzufriedenheit mit ElevenLabs

  Bedenken:
    - Trustpilot: 2.8/5 Sterne (Oktober 2025)
    - Credit-System unuebersichtlich
    - ToS Februar 2025: "perpetual, irrevocable license" auf Voice Data

RESEMBLE AI
===========
  Features:
    - Custom Voice Cloning
    - Real-time Speech-to-Speech
    - On-Premise Deployment moeglich
    - Ultrasonic Watermark (Deepfake-Detection)

  Staerken:
    - Pro-Tool fuer Fine-tuning
    - Enterprise-Level
    - Bessere Kontrolle

  Vergleich zu ElevenLabs:
    "Wenn ElevenLabs ein Serien-Auto ist,
     ist Resemble ein Kit-Car mit Extra-Knoepfen"

  Empfohlen fuer:
    - Grosse Projekte
    - Professionelle Voice Cloning
    - Datenschutz-kritische Anwendungen (On-Premise)

TECHNISCHER STACK FUER ANRUFE
=============================
  Komplett-Setup benoetigt:

  1. VOICE CLONING
     - ElevenLabs / Resemble AI
     - Deine geklonte Stimme

  2. TEXT-TO-SPEECH (TTS)
     - Wandelt LLM-Output in Sprache
     - Nutzt geklonte Stimme

  3. SPEECH-TO-TEXT (STT)
     - Whisper, Deepgram, Google STT
     - Transkribiert Anrufer

  4. LLM (GEHIRN)
     - Claude, GPT-4o, Gemini
     - Generiert Antworten

  5. TELEPHONY
     - Twilio, Telnyx
     - Verbindung zum Telefonnetz

  6. ORCHESTRATION
     - Vapi, Retell, Bland
     - Verbindet alle Komponenten

KOSTEN-UEBERBLICK
=================
  ElevenLabs:
    - Free Tier: 10.000 Zeichen/Monat
    - Starter: $5/Mo (30.000 Zeichen)
    - Creator: $22/Mo (100.000 Zeichen)
    - Pro: $99/Mo (500.000 Zeichen)

  Resemble AI:
    - Pay-as-you-go
    - Enterprise: Custom Pricing
    - On-Premise: Lizenzgebuehr

RECHTLICHE UND ETHISCHE ASPEKTE
===============================
  Wichtig:
    - Voice Cloning nur mit eigener Stimme
    - Keine Stimmen anderer Personen ohne Zustimmung
    - Deepfake-Risiken beachten
    - Transparenz: Anrufer ueber AI informieren?

  ElevenLabs ToS (Feb 2025):
    - Anbieter erhaelt weitreichende Rechte an Voice Data
    - Vor Nutzung ToS genau pruefen

SICHERHEITS-VERIFIKATION
========================
  Seriose Anbieter verlangen Live-Verifizierung:
    - Vorlesen eines zufaelligen Textes
    - Bestaetigung der Identitaet
    - Schutz vor Deepfake-Missbrauch

  WARNUNG: Betrugsszenarien mit Stimmklonen nehmen zu!
    - Enkeltrick mit geklonter Stimme
    - CEO-Fraud (gefaelschte Anweisungen)
    - Voice Phishing

  Daher: Voice Cloning oft reguliert

BACH-INTEGRATION
================
  Empfohlener Workflow:
    1. Eigene Stimme mit ElevenLabs/Resemble klonen
    2. Vapi/Retell als Orchestration
    3. Claude als Konversations-LLM
    4. Twilio fuer Telefonie

  Partner-Zuweisung:
    - ElevenLabs: Schnelle Voice Clones
    - Resemble: Enterprise, On-Premise
    - Claude: Konversationslogik
    - Vapi/Retell: Orchestration

ALTERNATIVEN OHNE VOICE CLONING
===============================
  Wenn eigene Stimme nicht noetig:
    - Stock Voices von ElevenLabs/PlayHT
    - Ueber 100 vorgefertigte Stimmen
    - Mehrere Sprachen und Akzente

SICHERHEITSHINWEISE
===================
  - Voice Data sind biometrische Daten (DSGVO!)
  - Nur bei vertrauenswuerdigen Anbietern hochladen
  - On-Premise bei sensiblen Anwendungen
  - Deepfake-Watermarking nutzen (Resemble)

SIEHE AUCH
==========
  wiki/automatisierung/telefon_service.txt
  wiki/automatisierung/avatar_videocalls.txt
  wiki/elevenlabs.txt (zu erstellen)
