Was ist ein KI-Telefon-Agent für Gastronomie?
Ein KI-Telefon-Agent für Gastronomie ist eine Sprach-KI, die Bestell-Anrufe von Gästen automatisch entgegennimmt und in strukturierte Bestellungen umwandelt. Der Agent versteht natürliche Sprache, kennt die komplette Speisekarte des Restaurants, fragt nach Adresse, Zahlart und Sonderwünschen und legt die Bestellung direkt im Bestellsystem oder Kassensystem ab. Er antwortet typischerweise unter einer Sekunde, ist 24/7 erreichbar und kann mehrere Sprachen.
So funktioniert ein KI-Telefon-Agent
Vereinfacht läuft ein Anruf in fünf Schritten ab:
- Anruf-Annahme: Anrufer wählt die Restaurant-Nummer (oder eine separate Voice-Agent-Nummer). Der Agent meldet sich namentlich, spielt eine kurze Aufzeichnungs-Einwilligung ein und beginnt das Gespräch.
- Speech-to-Text: Was der Anrufer sagt, wird live in Text transkribiert (typischerweise via OpenAI Whisper, AssemblyAI oder Deepgram). Latenz unter 200 ms.
- Verständnis-Pass: Ein LLM (GPT-4, Claude, oder ähnlich) interpretiert den Text im Kontext der Speisekarte und entscheidet, welche Frage oder Antwort als nächstes folgt.
- Text-to-Speech: Die Antwort wird in natürlich klingende Sprache umgewandelt (ElevenLabs, OpenAI TTS, oder ähnlich). Stimme oft konfigurierbar pro Restaurant.
- Bestell-Übergabe: Wenn die Bestellung komplett ist, schreibt der Agent sie direkt ins Bestellsystem oder die Kasse — als wäre sie eine Web-Bestellung. Bestätigungs-SMS oder -E-Mail folgt automatisch.
Was ein KI-Telefon-Agent für Restaurants leistet
- 24/7-Erreichbarkeit — keine verpassten Anrufe in Stoßzeiten, Mittagspausen oder nach Geschäftsschluss.
- Mehrsprachigkeit — wechselt automatisch zwischen Sprachen je nach Anrufer.
- Konsistente Bestell-Erfassung — keine Tipp-Fehler, keine vergessenen Sonderwünsche, alle Allergie-Hinweise dokumentiert.
- Direkt-Anbindung an Kasse — Bestellung erscheint auf dem Bondrucker oder Display, kein manuelles Übertragen.
- Personal-Entlastung — Bedienung kann sich auf Tisch-Service konzentrieren statt zwischen Telefon und Gästen zu pendeln.
- Datenbasis für Optimierung — alle Anrufe transkribiert und analysierbar, z.B. „Welche Gerichte werden am häufigsten falsch verstanden?".
Wann ein KI-Telefon-Agent NICHT die richtige Wahl ist
- Sehr beratungsintensive Gastronomie — Sterneküche mit individueller Menü-Beratung. Hier zählt die persönliche Stimme am Telefon stark zur Marke.
- Reservierungs-Schwerpunkt statt Bestellungen — Tisch-Reservierungen mit komplexen Wünschen (Geburtstag, Lieblingstisch, Allergien für 8 Personen) lösen sich besser über Reservierungs-Tools.
- Sehr geringes Anruf-Volumen — bei weniger als 5 Bestellanrufen pro Woche rechtfertigt sich die monatliche Pauschale finanziell selten.
- Sehr instabile Speisekarte — wenn das Tagesmenü mehrmals täglich wechselt und nicht im System gepflegt wird, hat der Agent keine verlässliche Datenbasis.
Auswahlkriterien
- Direkt-Anbindung an Bestell- und Kassensystem — sonst landet die Bestellung als E-Mail im Posteingang und das Personal muss sie manuell eintippen, was den Geschwindigkeits-Vorteil zunichte macht.
- Antwort-Latenz unter 1 Sekunde — alles darüber fühlt sich für den Anrufer roboterhaft und holprig an.
- Native Mehrsprachigkeit — nicht nur Übersetzung, sondern Sprache-erkennen-und-wechseln im laufenden Gespräch.
- Speisekarten-Verständnis inklusive Varianten und Beilagen — der Agent muss „eine Pizza Familie statt 32 cm" sauber differenzieren.
- Fallback auf menschliches Personal — wenn der Agent etwas nicht abschließen kann, muss er auf eine hinterlegte Nummer weiterleiten.
- DSGVO-konformes Aufzeichnungs-Handling — EU-Server, AVV, klare Einwilligungs-Ansage, kurze Speicherfrist.
- Transparente Abrechnung — Kosten pro Anrufminute oder pro Bestellung müssen vorher klar und im Dashboard nachvollziehbar sein.
Beispiel-Dialog
Anrufer: Hi, ich hätte gerne zwei Margherita zur Lieferung.
Agent: Klar — zwei Margherita zur Lieferung. In welcher Größe? Wir haben 28 cm, 32 cm oder Familie?
Anrufer: Beide 32 cm. Eine ohne Käse, mit extra Basilikum.
Agent: Verstanden — eine Margherita 32 cm normal, eine Margherita 32 cm ohne Käse mit extra Basilikum. Wie ist deine Lieferadresse?
Anrufer: Hauptstraße 12, 28195 Bremen.
Agent: Perfekt — 19,60 € Lieferung in etwa 35 Minuten. Möchtest du bar oder mit Karte zahlen?
Anrufer: Bar bitte.
Häufige Fragen
Wann lohnt sich ein KI-Telefon-Agent für ein Restaurant?+
Faustregel: ab fünf verpassten Anrufen pro Tag in Stoßzeiten. Eine verpasste Bestellung à 25 € Warenkorb-Schnitt entspricht etwa 10 Tagen typischer Voice-Agent-Anrufkosten — der Agent finanziert sich also bereits ab einer geretteten Bestellung pro Woche. Besonders relevant in Mittagsspitzen, am Wochenend-Abend und nach Schichtwechsel, wenn niemand am Telefon sein kann.
Welche Sprachen kann ein KI-Telefon-Agent?+
Moderne KI-Voice-Agents auf Basis von OpenAI Whisper oder ElevenLabs Conversational AI verstehen über 30 Sprachen. Für deutsche Gastronomie typisch relevant sind Deutsch, Englisch, Türkisch, Italienisch, Polnisch, Russisch, Französisch, Spanisch, Niederländisch und Arabisch. Der Agent erkennt automatisch in welcher Sprache der Anrufer spricht und antwortet im selben Moment in dieser Sprache.
Wie verstehen KI-Telefon-Agents Sonderwünsche und Allergien?+
Hochwertige Agents sind mit der vollständigen Speisekarte des Restaurants verbunden — inklusive Zutaten, Allergenen, Größen-Varianten und aktuell verfügbarer Beilagen. Wenn ein Anrufer „Pizza Margherita ohne Käse, mit extra Basilikum“ bestellt, parst der Agent das in strukturierte Daten und legt eine Bestellung mit den korrekten Modifikatoren ab. Bei Allergie-Hinweisen ergänzt der Agent in der Regel eine Notiz für die Küche und fragt aktiv nach.
Was kostet ein KI-Telefon-Agent für Restaurants?+
Drei Modelle dominieren: (1) reine SaaS-Pauschale ab 99–299 €/Monat ohne Anrufkosten (begrenzte Minuten), (2) Pauschale plus Anrufminute ab 5–15 Cent pro Minute, (3) reines Pay-per-Use ab 25–50 Cent pro Minute. Für ein typisches Restaurant mit 100–200 Bestellanrufen pro Monat (Schnitt 2 Min/Anruf) liegt das im niedrigen zweistelligen Bereich pro Monat zusätzlich zur Grundgebühr.
Funktioniert der KI-Telefon-Agent mit meinem Kassensystem?+
Wenn der Voice-Agent in ein Online-Bestellsystem integriert ist (wie bei DRIFT Order), nutzt er dieselbe POS-Anbindung wie die Web-Bestellungen. Der Anruf endet, die Bestellung erscheint sekundenschnell auf dem Kassen-Display oder dem Drucker — wie eine normale Online-Bestellung. Eigenständige Voice-Agents ohne Bestellsystem-Anbindung müssen die Bestellung per E-Mail oder Push-Benachrichtigung an das Personal übergeben, das sie dann manuell in die Kasse eintippt.
Wie unterscheidet sich ein KI-Telefon-Agent von einem klassischen Anrufbeantworter?+
Ein Anrufbeantworter speichert nur eine Sprachnachricht — das Personal muss sie später abhören, die Bestellung manuell aufschreiben und zurückrufen. Ein KI-Telefon-Agent führt das vollständige Bestellgespräch live: er fragt nach Adresse, Zahlart, Sonderwünschen, bestätigt die Bestellung mit Summe und voraussichtlicher Lieferzeit und legt sie direkt im System ab. Die Bestellung ist abgeschlossen wenn der Anrufer auflegt.
Was passiert wenn der KI-Telefon-Agent etwas nicht versteht?+
Gut konfigurierte Agents fragen aktiv nach (z.B. „Welche Größe meinst du, Familie oder 32 cm?“) oder reichen den Anruf an einen Menschen weiter. Bei DRIFT Order kann der Restaurant-Betreiber eine Fallback-Nummer hinterlegen — wenn der Agent eine Bestellung nicht abschließen kann, leitet er weiter. Anrufe werden mit Einwilligung des Anrufers für Quality-Control transkribiert und im Dashboard sichtbar.
Ist ein KI-Telefon-Agent DSGVO-konform?+
Ja, sofern der Anbieter Server in der EU betreibt, einen Auftragsverarbeitungs-Vertrag (AVV) mit dem Restaurant abschließt und vor Aufzeichnung eine klare Einwilligungs-Ansage einspielt. Hochwertige Anbieter speichern Audio-Daten verschlüsselt und löschen sie nach kurzer Frist (z.B. 30 Tage). Die Einwilligung muss zu Beginn des Anrufs verständlich kommuniziert werden („Dieser Anruf wird zur Bestellabwicklung aufgezeichnet, mit Auflegen erteilst du deine Einwilligung“).
Verwandte Artikel
- Online-Bestellsystem für Restaurants — Glossar-Eintrag
- Marktplatz vs. eigene Bestellseite — Vergleich
- DRIFT Order Preise (Voice Agent ist im Agent-Plan inkludiert)
- DRIFT Order Startseite
DRIFT Voice Agent ausprobieren
Der DRIFT Voice Agent ist im Agent-Plan inkludiert (299 €/Monat oder ab 189 €/Monat im 2-Jahres-Abo). Direkt-Anbindung an die DRIFT-Order-Storefront und an alle unterstützten POS-Systeme. Spricht Deutsch + 16 weitere Sprachen. 30 Tage kostenlos testen.
Voice Agent testen →Verfasst von Daniel Wist, Gründer von DRIFT Order. Zuletzt aktualisiert: 10. Mai 2026.