RAG

Abkürzungen / Synonyme: Retrieval-Augmented Generation

Kurzdefinition

Retrieval-Augmented Generation: Ein Verfahren, das LLMs mit externen Datenquellen verbindet, um fundierte Antworten mit Quellenbelegen zu generieren.

Ausführliche Erklärung

Retrieval-Augmented Generation (RAG) kombiniert die Sprachfähigkeit eines LLM mit einer externen, durchsuchbaren Wissensbasis. Statt sich auf das Trainingswissen zu verlassen, ruft das System zur Laufzeit relevante Dokument-Chunks ab und übergibt sie als Kontext an das Modell. Das reduziert Halluzinationen, ermöglicht aktuelle und mandantenspezifische Antworten und erlaubt nachvollziehbare Quellenangaben. Eine RAG-Pipeline besteht aus zwei Phasen: Ingestion (Bereinigen, Chunking, Embedding, Indexieren) sowie Retrieval & Generation (Suche, Kontextaufbau, Antwortgenerierung mit Citations).

Beispiel

Ein Support-Bot durchsucht per RAG die Produktdokumentation, findet die drei relevantesten Abschnitte und beantwortet die Kundenfrage mit Verweis auf die genauen Handbuchseiten.

Vertiefender Fachartikel

Im ausführlichen Fachartikel erklären wir RAG mit Architektur, Praxisbeispielen und Best Practices im Detail:

Fachartikel zu RAG aufrufen