Zum Hauptinhalt springen
Zuletzt aktualisiert: 1. September 2025
Großartige Ergebnisse hängen oft davon ab, die richtigen Engine-Einstellungen zu wählen. Verwenden Sie diese Checkliste beim Konfigurieren eines Assistenten:

1. Einen Modus wählen

ModusWarum diesen wählen?Hinweise
Dualplex (Beta)Schneller Sprecherwechsel + Premium/geklonte StimmenEmpfohlene Standardeinstellung. Kombinieren mit Gemini Flash 2.0/2.5 oder GPT‑5 Realtime.
Speech-to-Speech (Multimodal)Schnellster Sprecherwechsel & natürlichster FlussEmpfohlenes Modell: GPT‑5 Realtime.
PipelineMaximale Kontrolle über Stimme & lange AntwortenEmpfohlenes Modell: GPT‑5 Mini. Wenn Sie Pipeline wählen, fahren Sie mit dem Schritt Transcriber unten fort.
Möchten Sie mehr über die Unterschiede zwischen den Modi erfahren? Lesen Sie den Leitfaden zu Assistenten-Modi.
Experimentieren Sie mit allen drei Modi: Nehmen Sie dasselbe Szenario in jedem auf und vergleichen Sie Antwortzeit und Anruferzufriedenheit.

2. Einen Transcriber wählen (nur Pipeline)

TranscriberGenauigkeitLatenzAm besten für
Azure⭐⭐⭐⭐⏱️⏱️⏱️ (langsamer)Wenn Sie die höchste Transkriptionsgenauigkeit benötigen.
Gladia⭐⭐⭐⏱️ (schneller)Guter Allrounder für die meisten Sprachen.
Deepgram⭐⭐⭐⏱️ (schneller)Eine weitere solide Wahl – testen Sie, welche für Ihre Sprache & Audio-Einrichtung besser funktioniert.
Tipp: Verschiedene Sprachen, Akzente oder Hintergrundgeräusche können jede Engine unterschiedlich beeinflussen. Führen Sie einen schnellen A/B-Test durch und behalten Sie die beste.

3. Ein LLM-Modell auswählen

ModellStärkenKompromisse
GPT-5 MiniAusgewogenes Denken mit niedriger LatenzKann langsamer sein als Echtzeit-Modelle für schnellen Sprecherwechsel.
GPT-5 RealtimeEntwickelt für ultra-niedrige Latenz bei SprachwechselnAm besten für Speech-to-Speech und Dualplex.
GPT-4oStarkes Denken und multimodales VerständnisHöhere Latenz.
Gemini Flash 2.0 / 2.5Ultra-schnell für Sprachwechsel in Dualplex/MultimodalHervorragend zur Minimierung der wahrgenommenen Latenz.
Wenn Geschwindigkeit kritisch ist, verwenden Sie GPT‑5 Realtime (ideal für Speech-to-Speech) oder Gemini Flash 2.0/2.5 (ideal mit Dualplex). Für reichhaltigeres Denken verwenden Sie GPT-4o oder GPT-5 Mini und gleichen Sie die Latenz durch Füllaudios aus.

4. Geräuschunterdrückung

Wenn Anrufer auf Freisprecheinrichtung oder in einer ruhigen Umgebung sind, lassen Sie die Geräuschunterdrückung AN. Wenn Ihre Anruflautstärke niedrig ist oder einige Wörter “abgeschnitten” werden, schalten Sie sie AUS, damit der Transcriber die vollständige Wellenform erhält.
Wenn Ihr Assistent Sie nicht gut hört, können Sie versuchen, die Geräuschunterdrückung auszuschalten.

5. Gesprächs-Timer

ParameterEmpfohlenWarum
Re-engagement≈ 30 sGibt Anrufern genug Zeit zum Nachdenken. Niedrigere Werte können aufdringlich wirken.
Maximale Stille≈ 60 sVerhindert vorzeitiges Auflegen und beendet trotzdem wirklich stille Anrufe.
Testen Sie verschiedene Werte bei echten Anrufen – zu niedrig kann unterbrechen, zu hoch hinterlässt unangenehme Pausen.

6. Anfangsnachricht

ModusVerwendungBest Practice
PipelineWird genau wie geschrieben vorgelesen (durch TTS konvertiert).Schreiben Sie die Begrüßung wörtlich: “Hallo, hier ist Alex von …”.
DualplexWird genau wie geschrieben vorgelesen (gerendert über ElevenLabs TTS).Schreiben Sie die Begrüßung wörtlich und wählen Sie dann Ihre geklonte Stimme.
Speech-to-SpeechWird als Prompt vom Modell interpretiert.Fügen Sie Anweisungen wie “Begrüßen Sie den Kunden und sagen Sie …” hinzu oder stellen Sie sage genau: voran, um wörtliche Ausgabe sicherzustellen.

7. Umgebungsgeräusch

Standardmäßig aktiviert, ist Umgebungsgeräusch eine Funktion, die Hintergrundgeräusche zur Stimme des Assistenten hinzufügt.
Wenn der Assistent Sie nicht gut hört, können Sie versuchen, das Umgebungsgeräusch auszuschalten oder die Lautstärke zu verringern.

8. Endpointing-Regler

Steuern Sie, wann Ihr Assistent zu sprechen beginnt mit dem Endpointing-Empfindlichkeitsregler am Ende der Assistenteneinstellungen.
EinstellungWirkungVerwenden, wenn
Niedrigere EmpfindlichkeitAssistent antwortet schneller, nachdem der Anrufer aufhört zu sprechenSie schnelle, reaktionsschnelle Gespräche möchten
Höhere EmpfindlichkeitAssistent wartet länger, bevor er antwortetAnrufer längere, detailliertere Antworten geben
Profi-Tipp: Wenn Ihr Assistent Anrufer mitten im Satz unterbricht, erhöhen Sie die Empfindlichkeit. Wenn die Antworten träge wirken, verringern Sie sie.

9. Debuggen mit Anruftranskript

Wenn Sie Probleme mit Ihrem Assistenten haben, können Sie das Anruftranskript zum Debuggen verwenden.
  1. Gehen Sie zur Anrufverlaufsseite.
  2. Klicken Sie auf den letzten von Ihnen getesteten Anruf
  3. Das Anruftranskript wird angezeigt, einschließlich Funktionsaufrufen und deren Parametern.

10. Haben Sie noch Fragen?

Wenn Sie Fragen haben, kontaktieren Sie bitte unser Support-Team über das Chat-Widget in der App.
Testen Sie verschiedene Einstellungen mit echten Anrufen – das richtige Gleichgewicht hängt von Ihrem Gesprächsfluss und den Verhaltensmustern der Anrufer ab.

Benötigen Sie eine vollständige Liste aller Schalter und Regler? Siehe die vollständige Referenz zu Assistenteneinstellungen.