KI-Chatbot bauen: In vier Sprints zum lauffähigen Chatbot – verankert in deinen Daten

Q: Sollten wir Fine-Tuning oder RAG nutzen?

Fast immer RAG (Retrieval-Augmented Generation). Fine-Tuning wird selten benötigt und ist teuer in der Wartung. RAG verankert Antworten in deinen echten Dokumenten und liefert klickbare Quellenangaben.

Q: Welches Modell sollten wir nutzen?

Für die meisten Fälle ist GPT-4 via Microsoft EU Sovereignty der richtige Startpunkt. Mistral Medium 3 ist eine gute vollständig EU-basierte Alternative. Du kannst später wechseln, ohne die Anwendung neu zu schreiben.

Q: Wie gehen wir mit Halluzinationen um?

Jede Antwort in deinen echten Dokumenten verankern, klickbare Quellen zurückgeben, das Modell auf deine Quellen beschränken und einen Menschen in die Schleife einbauen, wo der Preis eines Fehlers hoch ist.

Q: Wie lange dauert die Auslieferung?

Unser RAG-Chatbot für Kompetenzz wurde in vier Sprints geliefert (etwa 10 Arbeitstage Aufwand). Die meisten Chatbots folgen einem ähnlichen Zeitplan.

Q: Wo gehen unsere Daten hin?

Das entscheidest du. Standardmäßig EU-gehostete Infrastruktur: n8n in Berlin, Qdrant in der EU, Azure OpenAI via Microsoft EU. Open-Source-selbstgehostete EU-Alternativen wie Milvus auf Wunsch.

Q: Kann unser Team es nach der Übergabe warten?

Ja. Wir übergeben eine Low-Code-Architektur und Dokumentation speziell, damit nicht-technische Mitarbeitende das System betreiben und erweitern können. Das Team Kompetenzz macht das für 1.000+ Mitglieder.

Die kurze Antwort

Um einen KI-Chatbot zu bauen, der wirklich funktioniert: Wähle einen konkreten User-Bedarf, verankerst du ihn in deinen eigenen Daten mit Retrieval-Augmented Generation (RAG), baust du die kleinste nützliche Version auf einem Low-Code-EU-gehosteten Stack und stellst du ihn echten Nutzer:innen schnell vor. Quellen zitieren. Human-in-the-Loop wo Fehler teuer sind. Iterieren. Die meisten Chatbot-Projekte scheitern nicht, weil die Technologie schwer ist, sondern weil sie nicht in echten Daten und echten Nutzerbedürfnissen verankert sind.

Was das in der Praxis bedeutet

Der klarste interne Chatbot-Leitfaden ist ein konkretes Beispiel. Kompetenzz kam mit einem unzuverlässigen Wissens-Chatbot zu uns. Standard-OpenAI-Assistants mit File-Search hatten nicht die Genauigkeit geliefert, die sie brauchten. Der Chatbot musste in HumHub leben – ihrem bestehenden Sozial-Netzwerk – und von einem nicht-technischen Team betrieben werden.

Wir haben Version 1 in vier kurzen Sprints geliefert: Systemarchitektur, RAG-Implementierung mit semantischer Suche, HumHub-Integration, vollständige Dokumentation. Geschätzter Gesamtaufwand 10 Arbeitstage. Stack: n8n in Berlin für Workflow-Orchestrierung, Qdrant in der EU für Vektorsuche, GPT-4 via Microsoft EU Sovereignty als LLM. Optionale vollständig Open-Source-EU-Alternativen: Mistral Medium 3 als Modell, Milvus als Vektordatenbank. Version 1 läuft jetzt produktiv für mehr als 1.000 Netzwerkmitglieder, mit Bezug zu aktuellen Gegebenheiten, von einem Nicht-Entwickler-Team betrieben.

Dieselbe RAG-Architektur unterstützt GDV (Gesamtverband der Deutschen Versicherungswirtschaft) über zehntausende Policy-Dokumente für 400+ Mitgliedsunternehmen, und eine KI-Mitgliederplattform für einen führenden deutschen Verband mit Chat-basierter Discovery und klassischen Kategoriefiltern.

Beispiel: KI-Wissensassistent in Aktion – die RAG-Architektur, die dieser Leitfaden beschreibt

Durch das Abspielen des Videos stimmen Sie der Übertragung von Daten an die jeweilige Videoplattform (z.B. YouTube, Vimeo) zu.

Zentrale Bestandteile

RAG, kein Fine-Tuning icon

RAG, kein Fine-Tuning

Retrieval-Augmented Generation verankert Antworten in deinen eigenen Dokumenten
Fast immer das richtige Muster – Fine-Tuning wird selten benötigt und ist teuer in der Wartung

EU-konformer Stack icon

EU-konformer Stack

n8n in Berlin, Qdrant in der EU, GPT-4 via Microsoft EU Sovereignty
Mistral oder Milvus für vollständig Open-Source-EU-Alternativen

Zitiert und verifizierbar icon

Zitiert und verifizierbar

Jede Antwort verlinkt auf das Quelldokument
Konversationelle Verfeinerung, damit Nutzer:innen ihre Anfrage in natürlicher Sprache eingrenzen können

Ergebnisse

Produktive Genauigkeit icon

Produktive Genauigkeit

Kompetenzz hat sich für RAG entschieden, nachdem Standard-OpenAI-Assistants unzuverlässig waren; unsere läuft produktiv für 1.000+ Mitglieder

Time to Value icon

Time to Value

in vier Sprints geliefert – die Kompetenzz-Timeline: Systemarchitektur, RAG, Integration, Dokumentation

Von deinem Team gewartet icon

Von deinem Team gewartet

Low-Code-Architektur, damit Nicht-Entwickler:innen ihn nach der Übergabe betreiben und erweitern können

Halluzinationen unter Kontrolle

Antworten in deinen echten Dokumenten verankert, Quellen zitiert und klickbar, Human-in-the-Loop wo es zählt

EU-AI-Act-ready

risiko-eingestuft, DSGVO-konform, mit Audit-Trails und Quellenangaben in der Architektur

**Lust auf ein Vorgespräch? Buche ein Telefonat: Kostenfrei, auf den Punkt.**

So funktioniert es

1. Architektur und Scope

Datenquellen, Integrationen und Modellansatz wählen
Die Sprints planen – so wie wir Kompetenzz gescopt haben

2. Bauen und iterieren

Lauffähige Software am Ende jedes Sprints
Echte Nutzer:innen davor, sobald möglich
Quellenangaben und Audit-Trails als Standard

3. Übergeben

Dokumentation, die ein:e nicht-technische Verantwortliche:r nutzen kann
Schulung, damit dein Team das System ohne uns erweitern kann
Optional laufender Support

Warum N3XTCODER

Wir bringen ein Jahrzehnt Impact-Tech-Erfahrung und über 160 KI-Projekte seit 2019 mit. Über unseren kostenlosen Kurs AI for Impact haben über 100.000 Menschen gelernt, KI für das Gemeinwohl einzusetzen. Wir machen keine Inspirationstage. Wir machen Scoping-Sessions und Build-Engagements, die in Produktion gehen – so wie wir KI für die folgenden Organisationen ausgeliefert haben:

Kompetenzz – produktiver RAG-Chatbot, der 1.000+ HumHub-Mitglieder bedient, auf n8n + Qdrant + GPT-4 via Microsoft EU, in vier Sprints geliefert
GDV (Gesamtverband der Deutschen Versicherungswirtschaft) – KI-Wissensassistent über zehntausende Policy-Dokumente für 400+ Mitgliedsunternehmen, auf Azure AI Search + GPT-4o via Microsoft AI Foundry. Recherchezeit halbiert, Schatten-KI verhindert, Mitarbeitendenzufriedenheit gesteigert
Ein führender deutscher Verband – KI-Mitgliederplattform ("Verbands-GPT") mit Chat-basierter Discovery und klassischen Kategoriefiltern, auf Microsoft AI Foundry + pgvector
innatura – KI-E-Mail-Agent mit verpflichtender menschlicher Prüfung im Pilot, auf N8N und Azure OpenAI
Tannenhof Berlin-Brandenburg – Civic-Coding-finanzierter KI-Transkriptionspilot für Therapiesitzungen auf EU-gehosteter Infrastruktur, Output formatiert für Berichte an die Deutsche Rentenversicherung
Civic Coding – KI-Beratung über 100 Sozial-Impact-Projekte unter Deutschlands Bundesinitiative
Standard-Stack: n8n in Berlin, Qdrant in der EU, Azure OpenAI via Microsoft EU Sovereignty, plus Open-Source-EU-Alternativen wie Mistral und Milvus auf Wunsch.

Ehrliche Grenzen

Standard-Assistants mit File-Search reichen nicht für Produktion. Kompetenzz hat das zuerst versucht. Es war unzuverlässig. RAG mit ordentlicher Verankerung und Quellenangaben macht den Unterschied.

Fine-Tuning ist fast nie die richtige Antwort. Es ist teuer, schwer zu warten und löst das Halluzinationsproblem nicht. Nutze stattdessen RAG gegen deine echten Dokumente.

Halluzinationen können nicht vollständig eliminiert werden. Reduziere sie mit Verankerung, Quellenangaben, eingeschränkten Prompts und menschlicher Prüfung bei folgenreichen Outputs. Akzeptiere, dass 100 Prozent Genauigkeit nicht das Ziel ist; belastbare Genauigkeit schon.

Häufige Fragen

Sollten wir Fine-Tuning oder RAG nutzen?

Welches Modell sollten wir nutzen?

Wie gehen wir mit Halluzinationen um?

Wie lange dauert die Auslieferung?

Wo gehen unsere Daten hin?

Kann unser Team es nach der Übergabe warten?

Bau deinen KI-Chatbot mit N3XTCODER

Erzähl uns von deinen Dokumenten und den Fragen, die dein Team oder deine Mitglieder immer wieder stellen. Wir antworten mit Vorschlag und Termin.

Simon Stegemann
Co-Founder and CEO

Weitere Services

KI Chatbot

KI Chatbot. Ein intelligenter Kundensupport-Assistent, der Nutzer zu den richtigen Inhalten und Aktionen führt. Verbessere deine Kundenerfahrung mit automatisiertem 24/7-Support.

Weiter lesen

KI Discovery Lab

Optimiere deine Produkt-Vision mit KI, Machine Learning und Data Expertise.

Weiter lesen

KI Wissensassistent

KI Wissensassistent für dein Team. Ein maßgeschneiderter KI-Chatbot, der sich mit deinen Daten auskennt. Erhalte sekundenschnell erhellende Einsichten auf der Grundlage deiner Daten.

Weiter lesen