Best Practices für Assistenten

Zuletzt aktualisiert: 1. September 2025

Großartige Ergebnisse hängen oft davon ab, die richtigen Engine-Einstellungen zu wählen. Verwenden Sie diese Checkliste beim Konfigurieren eines Assistenten:

1. Einen Modus wählen

Modus	Warum diesen wählen?	Hinweise
Dualplex (Beta)	Schneller Sprecherwechsel + Premium/geklonte Stimmen	Empfohlene Standardeinstellung. Kombinieren mit Gemini Flash 2.0/2.5 oder GPT‑5 Realtime.
Speech-to-Speech (Multimodal)	Schnellster Sprecherwechsel & natürlichster Fluss	Empfohlenes Modell: GPT‑5 Realtime.
Pipeline	Maximale Kontrolle über Stimme & lange Antworten	Empfohlenes Modell: GPT‑5 Mini. Wenn Sie Pipeline wählen, fahren Sie mit dem Schritt Transcriber unten fort.

Möchten Sie mehr über die Unterschiede zwischen den Modi erfahren? Lesen Sie den Leitfaden zu Assistenten-Modi.

Experimentieren Sie mit allen drei Modi: Nehmen Sie dasselbe Szenario in jedem auf und vergleichen Sie Antwortzeit und Anruferzufriedenheit.

2. Einen Transcriber wählen (nur Pipeline)

Transcriber	Genauigkeit	Latenz	Am besten für
Azure	⭐⭐⭐⭐	⏱️⏱️⏱️ (langsamer)	Wenn Sie die höchste Transkriptionsgenauigkeit benötigen.
Gladia	⭐⭐⭐	⏱️ (schneller)	Guter Allrounder für die meisten Sprachen.
Deepgram	⭐⭐⭐	⏱️ (schneller)	Eine weitere solide Wahl – testen Sie, welche für Ihre Sprache & Audio-Einrichtung besser funktioniert.

Tipp: Verschiedene Sprachen, Akzente oder Hintergrundgeräusche können jede Engine unterschiedlich beeinflussen. Führen Sie einen schnellen A/B-Test durch und behalten Sie die beste.

3. Ein LLM-Modell auswählen

Modell	Stärken	Kompromisse
GPT-5 Mini	Ausgewogenes Denken mit niedriger Latenz	Kann langsamer sein als Echtzeit-Modelle für schnellen Sprecherwechsel.
GPT-5 Realtime	Entwickelt für ultra-niedrige Latenz bei Sprachwechseln	Am besten für Speech-to-Speech und Dualplex.
GPT-4o	Starkes Denken und multimodales Verständnis	Höhere Latenz.
Gemini Flash 2.0 / 2.5	Ultra-schnell für Sprachwechsel in Dualplex/Multimodal	Hervorragend zur Minimierung der wahrgenommenen Latenz.

Wenn Geschwindigkeit kritisch ist, verwenden Sie GPT‑5 Realtime (ideal für Speech-to-Speech) oder Gemini Flash 2.0/2.5 (ideal mit Dualplex). Für reichhaltigeres Denken verwenden Sie GPT-4o oder GPT-5 Mini und gleichen Sie die Latenz durch Füllaudios aus.

4. Geräuschunterdrückung

Wenn Anrufer auf Freisprecheinrichtung oder in einer ruhigen Umgebung sind, lassen Sie die Geräuschunterdrückung AN. Wenn Ihre Anruflautstärke niedrig ist oder einige Wörter “abgeschnitten” werden, schalten Sie sie AUS, damit der Transcriber die vollständige Wellenform erhält.

Wenn Ihr Assistent Sie nicht gut hört, können Sie versuchen, die Geräuschunterdrückung auszuschalten.

5. Gesprächs-Timer

Parameter	Empfohlen	Warum
Re-engagement	`≈ 30 s`	Gibt Anrufern genug Zeit zum Nachdenken. Niedrigere Werte können aufdringlich wirken.
Maximale Stille	`≈ 60 s`	Verhindert vorzeitiges Auflegen und beendet trotzdem wirklich stille Anrufe.

Testen Sie verschiedene Werte bei echten Anrufen – zu niedrig kann unterbrechen, zu hoch hinterlässt unangenehme Pausen.

6. Anfangsnachricht

Modus	Verwendung	Best Practice
Pipeline	Wird genau wie geschrieben vorgelesen (durch TTS konvertiert).	Schreiben Sie die Begrüßung wörtlich: “Hallo, hier ist Alex von …”.
Dualplex	Wird genau wie geschrieben vorgelesen (gerendert über ElevenLabs TTS).	Schreiben Sie die Begrüßung wörtlich und wählen Sie dann Ihre geklonte Stimme.
Speech-to-Speech	Wird als Prompt vom Modell interpretiert.	Fügen Sie Anweisungen wie “Begrüßen Sie den Kunden und sagen Sie …” hinzu oder stellen Sie `sage genau:` voran, um wörtliche Ausgabe sicherzustellen.

7. Umgebungsgeräusch

Standardmäßig aktiviert, ist Umgebungsgeräusch eine Funktion, die Hintergrundgeräusche zur Stimme des Assistenten hinzufügt.

Wenn der Assistent Sie nicht gut hört, können Sie versuchen, das Umgebungsgeräusch auszuschalten oder die Lautstärke zu verringern.

8. Endpointing-Regler

Steuern Sie, wann Ihr Assistent zu sprechen beginnt mit dem Endpointing-Empfindlichkeitsregler am Ende der Assistenteneinstellungen.

Einstellung	Wirkung	Verwenden, wenn
Niedrigere Empfindlichkeit	Assistent antwortet schneller, nachdem der Anrufer aufhört zu sprechen	Sie schnelle, reaktionsschnelle Gespräche möchten
Höhere Empfindlichkeit	Assistent wartet länger, bevor er antwortet	Anrufer längere, detailliertere Antworten geben

Profi-Tipp: Wenn Ihr Assistent Anrufer mitten im Satz unterbricht, erhöhen Sie die Empfindlichkeit. Wenn die Antworten träge wirken, verringern Sie sie.

9. Debuggen mit Anruftranskript

Wenn Sie Probleme mit Ihrem Assistenten haben, können Sie das Anruftranskript zum Debuggen verwenden.

Gehen Sie zur Anrufverlaufsseite.
Klicken Sie auf den letzten von Ihnen getesteten Anruf
Das Anruftranskript wird angezeigt, einschließlich Funktionsaufrufen und deren Parametern.

10. Haben Sie noch Fragen?

Wenn Sie Fragen haben, kontaktieren Sie bitte unser Support-Team über das Chat-Widget in der App.

Testen Sie verschiedene Einstellungen mit echten Anrufen – das richtige Gleichgewicht hängt von Ihrem Gesprächsfluss und den Verhaltensmustern der Anrufer ab.

Benötigen Sie eine vollständige Liste aller Schalter und Regler? Siehe die vollständige Referenz zu Assistenteneinstellungen.

Einführung

Erste Schritte

KI-Assistenten Übersicht

Kampagnen

Leads

Benutzerdefinierte Dashboards

Telefonnummern

Eingehende Anrufe

Ausgehende Anrufe

KI-Prompting & Gesprächsgestaltung

Automatisierung & Integrationen

Kosten & Preise

Nummernbereitstellung

Fehlerbehebung & FAQs

1. Einen Modus wählen

2. Einen Transcriber wählen (nur Pipeline)

3. Ein LLM-Modell auswählen

4. Geräuschunterdrückung

5. Gesprächs-Timer

6. Anfangsnachricht

7. Umgebungsgeräusch

8. Endpointing-Regler

9. Debuggen mit Anruftranskript

10. Haben Sie noch Fragen?

​1. Einen Modus wählen

​2. Einen Transcriber wählen (nur Pipeline)

​3. Ein LLM-Modell auswählen

​4. Geräuschunterdrückung

​5. Gesprächs-Timer

​6. Anfangsnachricht

​7. Umgebungsgeräusch

​8. Endpointing-Regler

​9. Debuggen mit Anruftranskript

​10. Haben Sie noch Fragen?

1. Einen Modus wählen

2. Einen Transcriber wählen (nur Pipeline)

3. Ein LLM-Modell auswählen

4. Geräuschunterdrückung

5. Gesprächs-Timer

6. Anfangsnachricht

7. Umgebungsgeräusch

8. Endpointing-Regler

9. Debuggen mit Anruftranskript

10. Haben Sie noch Fragen?