Documentation Index
Fetch the complete documentation index at: https://docs.web-wb.de/llms.txt
Use this file to discover all available pages before exploring further.
Zuletzt aktualisiert: 1. September 2025Großartige Ergebnisse hängen oft davon ab, die richtigen Engine-Einstellungen zu wählen. Verwenden Sie diese Checkliste beim Konfigurieren eines Assistenten:
1. Einen Modus wählen
| Modus | Warum diesen wählen? | Hinweise |
|---|---|---|
| Dualplex (Beta) | Schneller Sprecherwechsel + Premium/geklonte Stimmen | Empfohlene Standardeinstellung. Kombinieren mit Gemini Flash 2.0/2.5 oder GPT‑5 Realtime. |
| Speech-to-Speech (Multimodal) | Schnellster Sprecherwechsel & natürlichster Fluss | Empfohlenes Modell: GPT‑5 Realtime. |
| Pipeline | Maximale Kontrolle über Stimme & lange Antworten | Empfohlenes Modell: GPT‑5 Mini. Wenn Sie Pipeline wählen, fahren Sie mit dem Schritt Transcriber unten fort. |
Experimentieren Sie mit allen drei Modi: Nehmen Sie dasselbe Szenario in jedem auf und vergleichen Sie Antwortzeit und Anruferzufriedenheit.
2. Einen Transcriber wählen (nur Pipeline)
| Transcriber | Genauigkeit | Latenz | Am besten für |
|---|---|---|---|
| Azure | ⭐⭐⭐⭐ | ⏱️⏱️⏱️ (langsamer) | Wenn Sie die höchste Transkriptionsgenauigkeit benötigen. |
| Gladia | ⭐⭐⭐ | ⏱️ (schneller) | Guter Allrounder für die meisten Sprachen. |
| Deepgram | ⭐⭐⭐ | ⏱️ (schneller) | Eine weitere solide Wahl – testen Sie, welche für Ihre Sprache & Audio-Einrichtung besser funktioniert. |
Tipp: Verschiedene Sprachen, Akzente oder Hintergrundgeräusche können jede Engine unterschiedlich beeinflussen. Führen Sie einen schnellen A/B-Test durch und behalten Sie die beste.
3. Ein LLM-Modell auswählen
| Modell | Stärken | Kompromisse |
|---|---|---|
| GPT-5 Mini | Ausgewogenes Denken mit niedriger Latenz | Kann langsamer sein als Echtzeit-Modelle für schnellen Sprecherwechsel. |
| GPT-5 Realtime | Entwickelt für ultra-niedrige Latenz bei Sprachwechseln | Am besten für Speech-to-Speech und Dualplex. |
| GPT-4o | Starkes Denken und multimodales Verständnis | Höhere Latenz. |
| Gemini Flash 2.0 / 2.5 | Ultra-schnell für Sprachwechsel in Dualplex/Multimodal | Hervorragend zur Minimierung der wahrgenommenen Latenz. |
4. Geräuschunterdrückung
Wenn Anrufer auf Freisprecheinrichtung oder in einer ruhigen Umgebung sind, lassen Sie die Geräuschunterdrückung AN. Wenn Ihre Anruflautstärke niedrig ist oder einige Wörter “abgeschnitten” werden, schalten Sie sie AUS, damit der Transcriber die vollständige Wellenform erhält.Wenn Ihr Assistent Sie nicht gut hört, können Sie versuchen, die Geräuschunterdrückung auszuschalten.
5. Gesprächs-Timer
| Parameter | Empfohlen | Warum |
|---|---|---|
| Re-engagement | ≈ 30 s | Gibt Anrufern genug Zeit zum Nachdenken. Niedrigere Werte können aufdringlich wirken. |
| Maximale Stille | ≈ 60 s | Verhindert vorzeitiges Auflegen und beendet trotzdem wirklich stille Anrufe. |
6. Anfangsnachricht
| Modus | Verwendung | Best Practice |
|---|---|---|
| Pipeline | Wird genau wie geschrieben vorgelesen (durch TTS konvertiert). | Schreiben Sie die Begrüßung wörtlich: “Hallo, hier ist Alex von …”. |
| Dualplex | Wird genau wie geschrieben vorgelesen (gerendert über ElevenLabs TTS). | Schreiben Sie die Begrüßung wörtlich und wählen Sie dann Ihre geklonte Stimme. |
| Speech-to-Speech | Wird als Prompt vom Modell interpretiert. | Fügen Sie Anweisungen wie “Begrüßen Sie den Kunden und sagen Sie …” hinzu oder stellen Sie sage genau: voran, um wörtliche Ausgabe sicherzustellen. |
7. Umgebungsgeräusch
Standardmäßig aktiviert, ist Umgebungsgeräusch eine Funktion, die Hintergrundgeräusche zur Stimme des Assistenten hinzufügt.Wenn der Assistent Sie nicht gut hört, können Sie versuchen, das Umgebungsgeräusch auszuschalten oder die Lautstärke zu verringern.
8. Endpointing-Regler
Steuern Sie, wann Ihr Assistent zu sprechen beginnt mit dem Endpointing-Empfindlichkeitsregler am Ende der Assistenteneinstellungen.| Einstellung | Wirkung | Verwenden, wenn |
|---|---|---|
| Niedrigere Empfindlichkeit | Assistent antwortet schneller, nachdem der Anrufer aufhört zu sprechen | Sie schnelle, reaktionsschnelle Gespräche möchten |
| Höhere Empfindlichkeit | Assistent wartet länger, bevor er antwortet | Anrufer längere, detailliertere Antworten geben |
9. Debuggen mit Anruftranskript
Wenn Sie Probleme mit Ihrem Assistenten haben, können Sie das Anruftranskript zum Debuggen verwenden.- Gehen Sie zur Anrufverlaufsseite.
- Klicken Sie auf den letzten von Ihnen getesteten Anruf
- Das Anruftranskript wird angezeigt, einschließlich Funktionsaufrufen und deren Parametern.
10. Haben Sie noch Fragen?
Wenn Sie Fragen haben, kontaktieren Sie bitte unser Support-Team über das Chat-Widget in der App.Testen Sie verschiedene Einstellungen mit echten Anrufen – das richtige Gleichgewicht hängt von Ihrem Gesprächsfluss und den Verhaltensmustern der Anrufer ab.
Benötigen Sie eine vollständige Liste aller Schalter und Regler? Siehe die vollständige Referenz zu Assistenteneinstellungen.
