Wie Hanc.AI funktioniert

Diese Seite erklärt die technische Architektur der Hanc.AI-Plattform — wie verschiedene Komponenten zusammenarbeiten, um intelligente Sprachkonversationen zu ermöglichen.

Systemarchitektur-Übersicht

┌─────────────────────────────────────────────────────────────────────────────┐
│                           HANC.AI PLATTFORM                                 │
└─────────────────────────────────────────────────────────────────────────────┘

                    ┌─────────────────────────────────────┐
                    │          IHRE KUNDEN                │
                    │                                     │
                    │   📞 Telefonanruf    🌐 Website     │
                    └──────────┬─────────────┬────────────┘
                               │             │
              ┌────────────────┘             └────────────────┐
              │                                              │
              ▼                                              ▼
┌─────────────────────────┐                    ┌─────────────────────────┐
│    TELEFONANBIETER      │                    │    WEBSITE-WIDGET       │
│    (Twilio)             │                    │    (LiveKit WebRTC)     │
│                         │                    │                         │
│  • Empfängt Anrufe      │                    │  • Browser-basierte     │
│  • Leitet an Agent      │                    │    Anrufe               │
│  • Handhabt Telefonie   │                    │  • Click-to-Call-Button │
│                         │                    │  • Keine App nötig      │
└───────────┬─────────────┘                    └───────────┬─────────────┘
            │                                              │
            └──────────────────┬───────────────────────────┘
                               │
                               ▼
┌─────────────────────────────────────────────────────────────────────────────┐
│                         VOICE SERVICE LAYER                                 │
│                                                                             │
│  ┌─────────────┐    ┌─────────────┐    ┌─────────────┐    ┌─────────────┐  │
│  │   Sprache   │    │     KI      │    │   Text zu   │    │   Audio     │  │
│  │   zu Text   │───▶│   Engine    │───▶│   Sprache   │───▶│   Stream    │  │
│  │   (STT)     │    │   (LLM)     │    │   (TTS)     │    │             │  │
│  └─────────────┘    └──────┬──────┘    └─────────────┘    └─────────────┘  │
│                            │                                                │
└────────────────────────────┼────────────────────────────────────────────────┘
                             │
                             ▼
┌─────────────────────────────────────────────────────────────────────────────┐
│                         HANC.AI BACKEND                                     │
│                                                                             │
│  ┌─────────────────┐  ┌─────────────────┐  ┌─────────────────┐             │
│  │  Agent-Konfig   │  │ Wissensdatenbank│  │   Call Logs     │             │
│  │  • Prompt       │  │  • Dokumente    │  │  • Verlauf      │             │
│  │  • Einstellungen│  │  • RAG-Suche    │  │  • Transkripte  │             │
│  │  • Tools        │  │  • Embeddings   │  │  • Analytics    │             │
│  └─────────────────┘  └─────────────────┘  └─────────────────┘             │
│                                                                             │
│  ┌─────────────────┐  ┌─────────────────┐  ┌─────────────────┐             │
│  │  Benutzerkonten │  │  Integrationen  │  │   Abrechnung    │             │
│  │  • Auth         │  │  • Twilio       │  │  • Tarife       │             │
│  │  • Workspaces   │  │  • Kalender     │  │  • Nutzung      │             │
│  │  • Teams        │  │  • Webhooks     │  │  • Zahlungen    │             │
│  └─────────────────┘  └─────────────────┘  └─────────────────┘             │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘
                               │
                               ▼
┌─────────────────────────────────────────────────────────────────────────────┐
│                         IHR DASHBOARD                                       │
│                                                                             │
│   🎛️ Agenten konfigurieren   📊 Analytics ansehen    📞 Nummern verwalten  │
│   📚 Wissen hochladen        👥 Team verwalten       💳 Abrechnung          │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘

Anrufablauf: Schritt für Schritt

Szenario: Kunde ruft Ihr Unternehmen an

Verfolgen wir, was passiert, wenn ein Kunde Ihre Twilio-Nummer anruft, die mit einem Hanc.AI-Agenten verbunden ist:

ZEIT        EREIGNIS                           SYSTEM
─────────────────────────────────────────────────────────────────────
0:00        Kunde wählt +43 1 234 5678         Telefonnetz

0:02        Anruf erreicht Twilio              Twilio
            Twilio leitet an Hanc.AI weiter

0:03        Agent aktiviert                    Hanc.AI Voice Service
            Audio-Stream hergestellt

0:04        Agent spricht erste Nachricht:     TTS-Engine
            "Hallo! Danke für Ihren Anruf bei
            ABC Zahnarzt. Wie kann ich helfen?"

0:06        Kunde: "Ich möchte einen Termin    STT-Engine
            für nächste Woche buchen"

0:07        Text wird an KI-Engine gesendet    LLM (z.B. GPT-4)
            KI durchsucht Wissensdatenbank     RAG-System

0:08        KI generiert Antwort:              LLM
            "Gerne helfe ich Ihnen dabei.
            Welcher Tag passt Ihnen am besten?"

0:09        Antwort wird in Sprache umgewandelt TTS-Engine
            Audio an Kunden gesendet

0:10        Kunde: "Wie wäre es Dienstag       STT-Engine
            um 15 Uhr?"

0:11        KI prüft Verfügbarkeit             Kalender-Integration
            (wenn Kalender verbunden)

0:12        KI: "Dienstag um 15 Uhr ist frei.  LLM + TTS
            Darf ich Ihren Namen erfahren?"

            ... Gespräch wird fortgesetzt ...

2:45        Anruf endet
            Transkript gespeichert             Hanc.AI Backend
            Analytics aktualisiert

Komponenten im Detail

1. Speech-to-Text (STT)

Wandelt die Stimme des Kunden in Text um, den die KI verarbeiten kann.

┌─────────────────────────────────────────────────────────────────┐
│                    SPEECH-TO-TEXT-PIPELINE                      │
└─────────────────────────────────────────────────────────────────┘

Audio-Stream ───▶ Rauschreduzierung ───▶ Stimmerkennung ───▶ Transkription
                                                                   │
                                                                   ▼
                                                            "Ich muss
                                                            einen Termin
                                                            buchen"

Hauptmerkmale:

Echtzeit-Verarbeitung (< 500ms Latenz)
Mehrsprachige Unterstützung
Akzent-Anpassung
Hintergrundgeräusch-Handling

2. KI-Engine (LLM)

Das "Gehirn", das Kontext versteht und Antworten generiert.

┌─────────────────────────────────────────────────────────────────┐
│                      KI-ENGINE-PROZESS                          │
└─────────────────────────────────────────────────────────────────┘

         Eingabe: "Was kosten Ihre Zahnreinigungen?"
                              │
                              ▼
┌─────────────────────────────────────────────────────────────────┐
│                     KONTEXT-ZUSAMMENSTELLUNG                    │
│                                                                 │
│  System-Prompt (wie sich verhalten)                             │
│  + Konversationsverlauf (was vorher gesagt wurde)               │
│  + Wissensdatenbank-Ergebnisse (relevante Geschäftsinfos)       │
│  + Aktuelle Benutzernachricht                                   │
│                                                                 │
└──────────────────────────────┬──────────────────────────────────┘
                               │
                               ▼
┌─────────────────────────────────────────────────────────────────┐
│                    LLM-VERARBEITUNG                             │
│                                                                 │
│  Anbieter: OpenAI / Anthropic / Google                          │
│  Modell: GPT-4o / Claude 3.5 / Gemini Pro                       │
│                                                                 │
│  Das Modell verarbeitet den gesamten Kontext und generiert      │
│  die passendste Antwort                                         │
│                                                                 │
└──────────────────────────────┬──────────────────────────────────┘
                               │
                               ▼
         Ausgabe: "Unsere Standard-Zahnreinigung kostet 80€ und
                 eine Tiefenreinigung 120€. Möchten Sie
                 einen Termin vereinbaren?"

3. Wissensdatenbank (RAG)

Ruft relevante Informationen aus Ihren Dokumenten ab.

┌─────────────────────────────────────────────────────────────────┐
│                    RAG-ABRUFPROZESS                             │
└─────────────────────────────────────────────────────────────────┘

Benutzerfrage: "Was kosten Ihre Leistungen?"
                    │
                    ▼
┌─────────────────────────────────────────────────────────────────┐
│               EMBEDDING & SUCHE                                 │
│                                                                 │
│  1. Frage in Vektor umwandeln (Embedding)                       │
│  2. Dokumentvektoren nach ähnlichem Inhalt durchsuchen          │
│  3. Beste passende Abschnitte abrufen                           │
│                                                                 │
└──────────────────────────────┬──────────────────────────────────┘
                               │
                               ▼
┌─────────────────────────────────────────────────────────────────┐
│               ABGERUFENE DOKUMENTE                              │
│                                                                 │
│  Abschnitt 1: "Leistungen und Preise:                           │
│           - Standard-Reinigung: 80€                             │
│           - Tiefenreinigung: 120€                               │
│           - Bleaching: 200€"                                    │
│                                                                 │
│  Abschnitt 2: "Sonderangebote:                                  │
│           - Erstbesuch 10% Rabatt                               │
│           - 3er-Paket Reinigungen: 200€"                        │
│                                                                 │
└──────────────────────────────┬──────────────────────────────────┘
                               │
                               ▼
                    An LLM als Kontext gesendet

4. Text-to-Speech (TTS)

Wandelt die Textantwort der KI in natürlich klingende Sprache um.

┌─────────────────────────────────────────────────────────────────┐
│                    TEXT-TO-SPEECH-PIPELINE                      │
└─────────────────────────────────────────────────────────────────┘

Textantwort ───▶ Textverarbeitung ───▶ Stimmsynthese ───▶ Audio-Ausgabe
                        │                      │
                        │                      │
                        ▼                      ▼
                 • Interpunktion         • Ausgewählte Stimme
                 • Zahlen (80€)          • Geschwindigkeits-
                 • Abkürzungen             einstellung
                                         • Emotion/Tonfall

Stimmoptionen:

Mehrere Sprachen
Männliche/weibliche Stimmen
Verschiedene Alter und Stile
Einstellbare Sprechgeschwindigkeit

Datenfluss

Welche Daten werden gespeichert?

┌─────────────────────────────────────────────────────────────────┐
│                    DATENSPEICHERUNG                             │
└─────────────────────────────────────────────────────────────────┘

┌─────────────────┐     ┌─────────────────┐     ┌─────────────────┐
│  Konfiguration  │     │   Anrufdaten    │     │  Benutzerdaten  │
│                 │     │                 │     │                 │
│  • Prompts      │     │  • Transkripte  │     │  • Konten       │
│  • Einstellungen│     │  • Aufnahmen    │     │  • Workspaces   │
│  • Wissen       │     │  • Metadaten    │     │  • Abrechnung   │
│  • Agent-Tools  │     │  • Analytics    │     │  • Teams        │
│                 │     │                 │     │                 │
└─────────────────┘     └─────────────────┘     └─────────────────┘
        │                       │                       │
        └───────────────────────┴───────────────────────┘
                                │
                                ▼
                    ┌─────────────────────┐
                    │   Sichere Datenbank │
                    │   (Verschlüsselt)   │
                    └─────────────────────┘

Datenschutz

Datentyp	Speicherung	Aufbewahrung	Zugriff
Anrufaufnahmen	Verschlüsselter Cloud-Speicher	Konfigurierbar	Nur Workspace-Admins
Transkripte	Datenbank	Konfigurierbar	Workspace-Mitglieder
Wissensdatenbank	Datenbank + Vektorspeicher	Bis zur Löschung	Workspace-Mitglieder
Benutzerkonten	Datenbank	Bis zur Kontolöschung	Benutzer + Admins
Analytics	Aggregierte Datenbank	12 Monate	Workspace-Mitglieder

Integrationspunkte

Telefon-Integration (Twilio)

┌─────────────────────────────────────────────────────────────────┐
│                    TWILIO-INTEGRATION                           │
└─────────────────────────────────────────────────────────────────┘

Ihr Twilio-Konto                            Hanc.AI
       │                                        │
       │  1. Telefonnummer kaufen               │
       │  2. Konto über API-Keys verbinden      │
       │  3. Webhook zu Hanc.AI konfigurieren   │
       │                                        │
       ▼                                        ▼
┌─────────────────┐    Eingehender Anruf  ┌─────────────────┐
│  Telefonnummer  │───────────────────▶  │  Sprachagent    │
│  +43 1 234 5678 │                      │  "Empfang"      │
│                 │◀───────────────────  │                 │
└─────────────────┘    Audio-Stream       └─────────────────┘

Kalender-Integration

┌─────────────────────────────────────────────────────────────────┐
│                    KALENDER-INTEGRATION                         │
└─────────────────────────────────────────────────────────────────┘

Wenn Agent einen Termin buchen muss:

Agent: "Lassen Sie mich die Verfügbarkeit prüfen..."
              │
              ▼
┌─────────────────┐    ┌─────────────────┐    ┌─────────────────┐
│  Hanc.AI Agent  │───▶│  Kalender-API   │───▶│  Google/Outlook │
│                 │    │                 │    │  Kalender       │
│  Ist Dienstag   │    │  GET /events    │    │                 │
│  15 Uhr frei?   │    │  POST /events   │    │  ✓ Dienstag     │
│                 │◀───│                 │◀───│    15 Uhr frei  │
└─────────────────┘    └─────────────────┘    └─────────────────┘
              │
              ▼
Agent: "Dienstag um 15 Uhr ist frei.
        Soll ich das für Sie buchen?"

Webhook-Integration

┌─────────────────────────────────────────────────────────────────┐
│                    WEBHOOK-EREIGNISSE                           │
└─────────────────────────────────────────────────────────────────┘

Wenn bestimmte Ereignisse eintreten, sendet Hanc.AI Daten an Ihre Systeme:

Ereignis: Anruf beendet
              │
              ▼
┌─────────────────┐         ┌─────────────────┐
│    Hanc.AI      │  POST   │   Ihr Server    │
│                 │────────▶│                 │
│  {              │         │  • CRM updaten  │
│    "event":     │         │  • E-Mail senden│
│    "call_ended",│         │  • Daten loggen │
│    "duration":  │         │  • Workflow     │
│    165,         │         │    auslösen     │
│    "transcript":│         │                 │
│    "..."        │         │                 │
│  }              │         │                 │
└─────────────────┘         └─────────────────┘

Leistungsmerkmale

Latenz-Aufschlüsselung

Phase	Typische Latenz	Beschreibung
STT-Verarbeitung	200-500ms	Sprache in Text umwandeln
LLM-Verarbeitung	500-1500ms	KI generiert Antwort
RAG-Abruf	100-300ms	Wissensdatenbank durchsuchen
TTS-Generierung	200-400ms	Text in Sprache umwandeln
Gesamt	1-3 Sekunden	End-to-End-Antwortzeit

Skalierbarkeit

Die Plattform bewältigt:

Gleichzeitige Anrufe: Hunderte von simultanen Gesprächen
Wissensdatenbankgröße: Millionen von Dokumentabschnitten
Globale Verfügbarkeit: Multi-Region-Deployment

Sicherheitsarchitektur

┌─────────────────────────────────────────────────────────────────┐
│                    SICHERHEITSSCHICHTEN                         │
└─────────────────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────────────────┐
│  Authentifizierungsschicht                                      │
│  • Firebase Authentication                                       │
│  • Session-Tokens (HttpOnly Cookies)                            │
│  • Telefonverifizierung                                         │
└─────────────────────────────────────────────────────────────────┘
                               │
                               ▼
┌─────────────────────────────────────────────────────────────────┐
│  Autorisierungsschicht                                          │
│  • Workspace-basierte Zugriffskontrolle                         │
│  • Rollenbasierte Berechtigungen                                │
│  • API-Key-Scoping                                              │
└─────────────────────────────────────────────────────────────────┘
                               │
                               ▼
┌─────────────────────────────────────────────────────────────────┐
│  Datenschutzschicht                                             │
│  • Verschlüsselung im Ruhezustand (AES-256)                     │
│  • Verschlüsselung bei Übertragung (TLS 1.3)                    │
│  • Datenisolierung zwischen Workspaces                          │
└─────────────────────────────────────────────────────────────────┘

Zusammenfassung

Die Hanc.AI-Plattform kombiniert mehrere Technologien:

Sprachverarbeitung — Echtzeit Speech-to-Text und Text-to-Speech
KI-Intelligenz — Large Language Models für Verständnis und Antwort
Wissensabruf — RAG-System für geschäftsspezifische Informationen
Telefonie — Telefonnummernverwaltung und Anrufweiterleitung
Integrationen — Kalender, CRMs und benutzerdefinierte Webhooks

All dies arbeitet nahtlos zusammen, damit Sie sich auf die Konfiguration der Persönlichkeit und des Wissens Ihres Agenten konzentrieren können, während die Plattform die technische Komplexität übernimmt.

Nächste Schritte

Kontoeinrichtung — Erstellen Sie Ihr Hanc.AI-Konto
Plattformübersicht — Navigieren Sie durch das Dashboard
Ihr erster Agent — Bauen Sie Ihren ersten Sprachagenten

Systemarchitektur-Übersicht​

Anrufablauf: Schritt für Schritt​

Szenario: Kunde ruft Ihr Unternehmen an​

Komponenten im Detail​

1. Speech-to-Text (STT)​

2. KI-Engine (LLM)​

3. Wissensdatenbank (RAG)​

4. Text-to-Speech (TTS)​

Datenfluss​

Welche Daten werden gespeichert?​

Datenschutz​

Integrationspunkte​

Telefon-Integration (Twilio)​

Kalender-Integration​

Webhook-Integration​

Leistungsmerkmale​

Latenz-Aufschlüsselung​

Skalierbarkeit​

Sicherheitsarchitektur​

Zusammenfassung​

Nächste Schritte​