Zuletzt aktualisiert: 1. September 2025
Großartige Ergebnisse hängen oft davon ab, die richtigen Engine-Einstellungen zu wählen. Verwenden Sie diese Checkliste beim Konfigurieren eines Assistenten:
1. Einen Modus wählen
| Modus | Warum diesen wählen? | Hinweise |
|---|
| Dualplex (Beta) | Schneller Sprecherwechsel + Premium/geklonte Stimmen | Empfohlene Standardeinstellung. Kombinieren mit Gemini Flash 2.0/2.5 oder GPT‑5 Realtime. |
| Speech-to-Speech (Multimodal) | Schnellster Sprecherwechsel & natürlichster Fluss | Empfohlenes Modell: GPT‑5 Realtime. |
| Pipeline | Maximale Kontrolle über Stimme & lange Antworten | Empfohlenes Modell: GPT‑5 Mini. Wenn Sie Pipeline wählen, fahren Sie mit dem Schritt Transcriber unten fort. |
Möchten Sie mehr über die Unterschiede zwischen den Modi erfahren? Lesen Sie den Leitfaden zu Assistenten-Modi.
Experimentieren Sie mit allen drei Modi: Nehmen Sie dasselbe Szenario in jedem auf und vergleichen Sie Antwortzeit und Anruferzufriedenheit.
2. Einen Transcriber wählen (nur Pipeline)
| Transcriber | Genauigkeit | Latenz | Am besten für |
|---|
| Azure | ⭐⭐⭐⭐ | ⏱️⏱️⏱️ (langsamer) | Wenn Sie die höchste Transkriptionsgenauigkeit benötigen. |
| Gladia | ⭐⭐⭐ | ⏱️ (schneller) | Guter Allrounder für die meisten Sprachen. |
| Deepgram | ⭐⭐⭐ | ⏱️ (schneller) | Eine weitere solide Wahl – testen Sie, welche für Ihre Sprache & Audio-Einrichtung besser funktioniert. |
Tipp: Verschiedene Sprachen, Akzente oder Hintergrundgeräusche können jede Engine unterschiedlich beeinflussen. Führen Sie einen schnellen A/B-Test durch und behalten Sie die beste.
3. Ein LLM-Modell auswählen
| Modell | Stärken | Kompromisse |
|---|
| GPT-5 Mini | Ausgewogenes Denken mit niedriger Latenz | Kann langsamer sein als Echtzeit-Modelle für schnellen Sprecherwechsel. |
| GPT-5 Realtime | Entwickelt für ultra-niedrige Latenz bei Sprachwechseln | Am besten für Speech-to-Speech und Dualplex. |
| GPT-4o | Starkes Denken und multimodales Verständnis | Höhere Latenz. |
| Gemini Flash 2.0 / 2.5 | Ultra-schnell für Sprachwechsel in Dualplex/Multimodal | Hervorragend zur Minimierung der wahrgenommenen Latenz. |
Wenn Geschwindigkeit kritisch ist, verwenden Sie GPT‑5 Realtime (ideal für Speech-to-Speech) oder Gemini Flash 2.0/2.5 (ideal mit Dualplex). Für reichhaltigeres Denken verwenden Sie GPT-4o oder GPT-5 Mini und gleichen Sie die Latenz durch Füllaudios aus.
4. Geräuschunterdrückung
Wenn Anrufer auf Freisprecheinrichtung oder in einer ruhigen Umgebung sind, lassen Sie die Geräuschunterdrückung AN. Wenn Ihre Anruflautstärke niedrig ist oder einige Wörter “abgeschnitten” werden, schalten Sie sie AUS, damit der Transcriber die vollständige Wellenform erhält.
Wenn Ihr Assistent Sie nicht gut hört, können Sie versuchen, die Geräuschunterdrückung auszuschalten.
5. Gesprächs-Timer
| Parameter | Empfohlen | Warum |
|---|
| Re-engagement | ≈ 30 s | Gibt Anrufern genug Zeit zum Nachdenken. Niedrigere Werte können aufdringlich wirken. |
| Maximale Stille | ≈ 60 s | Verhindert vorzeitiges Auflegen und beendet trotzdem wirklich stille Anrufe. |
Testen Sie verschiedene Werte bei echten Anrufen – zu niedrig kann unterbrechen, zu hoch hinterlässt unangenehme Pausen.
6. Anfangsnachricht
| Modus | Verwendung | Best Practice |
|---|
| Pipeline | Wird genau wie geschrieben vorgelesen (durch TTS konvertiert). | Schreiben Sie die Begrüßung wörtlich: “Hallo, hier ist Alex von …”. |
| Dualplex | Wird genau wie geschrieben vorgelesen (gerendert über ElevenLabs TTS). | Schreiben Sie die Begrüßung wörtlich und wählen Sie dann Ihre geklonte Stimme. |
| Speech-to-Speech | Wird als Prompt vom Modell interpretiert. | Fügen Sie Anweisungen wie “Begrüßen Sie den Kunden und sagen Sie …” hinzu oder stellen Sie sage genau: voran, um wörtliche Ausgabe sicherzustellen. |
7. Umgebungsgeräusch
Standardmäßig aktiviert, ist Umgebungsgeräusch eine Funktion, die Hintergrundgeräusche zur Stimme des Assistenten hinzufügt.
Wenn der Assistent Sie nicht gut hört, können Sie versuchen, das Umgebungsgeräusch auszuschalten oder die Lautstärke zu verringern.
8. Endpointing-Regler
Steuern Sie, wann Ihr Assistent zu sprechen beginnt mit dem Endpointing-Empfindlichkeitsregler am Ende der Assistenteneinstellungen.
| Einstellung | Wirkung | Verwenden, wenn |
|---|
| Niedrigere Empfindlichkeit | Assistent antwortet schneller, nachdem der Anrufer aufhört zu sprechen | Sie schnelle, reaktionsschnelle Gespräche möchten |
| Höhere Empfindlichkeit | Assistent wartet länger, bevor er antwortet | Anrufer längere, detailliertere Antworten geben |
Profi-Tipp: Wenn Ihr Assistent Anrufer mitten im Satz unterbricht, erhöhen Sie die Empfindlichkeit. Wenn die Antworten träge wirken, verringern Sie sie.
9. Debuggen mit Anruftranskript
Wenn Sie Probleme mit Ihrem Assistenten haben, können Sie das Anruftranskript zum Debuggen verwenden.
- Gehen Sie zur Anrufverlaufsseite.
- Klicken Sie auf den letzten von Ihnen getesteten Anruf
- Das Anruftranskript wird angezeigt, einschließlich Funktionsaufrufen und deren Parametern.
10. Haben Sie noch Fragen?
Wenn Sie Fragen haben, kontaktieren Sie bitte unser Support-Team über das Chat-Widget in der App.
Testen Sie verschiedene Einstellungen mit echten Anrufen – das richtige Gleichgewicht hängt von Ihrem Gesprächsfluss und den Verhaltensmustern der Anrufer ab.
Benötigen Sie eine vollständige Liste aller Schalter und Regler? Siehe die vollständige
Referenz zu Assistenteneinstellungen.