RAG
- Fakten aktualisieren – Dokument bearbeiten, neu indexieren – in Minuten erledigt; kein Neutraining nötig
- Quellen zitieren – nativ; jede Antwort verweist direkt auf das Quelldokument
- Kosten – Vektor-Datenbank + LLM-Inferenz; planbar und skalierbar
- Compliance-Position – einfach; die Source-of-truth liegt in deiner Datenbank, auditierbar und auf Anfrage löschbar
- Stil und Format – begrenzt; RAG trainiert das Modell nicht, daher bleiben Ausgabeformat und Tonfall prompting-abhängig
Fine-Tuning
- Fakten aktualisieren – Modell neu trainieren, validieren, neu deployen – Stunden bis Tage, jedes Mal; bei häufig wechselnden Inhalten nicht praktikabel
- Quellen zitieren – nicht möglich; das Modell kann nicht zeigen, woher ein im Training aufgenommener Fakt stammt
- Kosten – Rechenpower für das Training im Voraus, höhere Grundkosten, schwerer zu schätzen; Inferenzkosten kommen obendrauf
- Compliance-Position – schwer; einen bestimmten Fakt ohne Neutraining zu entfernen ist faktisch unmöglich – das DSGVO-Recht auf Löschung lässt sich kaum erfüllen
- Stil und Format – hier glänzt es; konsistentes Ausgabeformat oder ein spezifischer Tonfall, der sich durch Prompting allein nicht erreichen lässt
