Retrieval-Augmented Generation

Citations im RAG: Vertrauenswürdige Antworten mit Quellenangaben

Citations (Quellenangaben) sind das Vertrauensfundament jedes ernsthaften RAG-Systems. Sie verknüpfen jede Aussage der generierten Antwort mit dem konkreten Dokument, aus dem die Information stammt. Damit verwandeln Citations eine Blackbox-Antwort in eine überprüfbare Aussage – und sind oft der Unterschied zwischen einem netten Prototyp und einem produktiv einsetzbaren System.

Warum Citations unverzichtbar sind

Ein Large Language Model klingt auch dann überzeugend, wenn es halluziniert. Ohne Quellenangaben kann der Nutzer nicht unterscheiden, ob eine Aussage belegt oder erfunden ist. Citations lösen drei Probleme gleichzeitig:

  • Überprüfbarkeit: Nutzer können jede Aussage zur Originalquelle zurückverfolgen.
  • Vertrauen: Sichtbare Belege erhöhen die Akzeptanz, besonders in Fachabteilungen.
  • Fehlererkennung: Passt die zitierte Quelle nicht zur Aussage, ist das ein klares Warnsignal für eine Halluzination.

Wie Citations technisch funktionieren

Citations entstehen nicht im Modell von selbst – sie müssen durch die RAG-Architektur erzwungen werden. Der typische Ablauf:

  1. Kennungen vergeben: Jeder Chunk erhält bei der Ingestion eine eindeutige ID (z. B. doc42#abschnitt3).
  2. Kontext mit IDs übergeben: Die abgerufenen Chunks werden inklusive ihrer Kennungen in den Prompt eingefügt.
  3. Beleg erzwingen: Der System-Prompt weist das Modell an, jede Aussage mit der passenden Kennung zu markieren.
  4. Auflösen: Die Anwendung ersetzt die Kennungen durch anklickbare Links auf das Originaldokument.

Ein vereinfachter Prompt-Ausschnitt:

Beantworte die Frage nur anhand der nummerierten Quellen.
Markiere jede Aussage mit [Quelle:ID]. Wenn keine Quelle passt,
antworte: "Dazu liegen mir keine Informationen vor."

[1] doc42#abschnitt3: Rücksendungen sind innert 30 Tagen möglich.
[2] doc17#abschnitt1: Die Rückerstattung erfolgt binnen 14 Tagen.

Mögliche Antwort des Modells:

Rücksendungen sind innerhalb von 30 Tagen möglich [Quelle:1].
Die Rückerstattung erfolgt anschliessend binnen 14 Tagen [Quelle:2].

Citation-Stile im Vergleich

StilBeschreibungGeeignet für
Inline-Marker[1], [2] direkt im TextChat-Oberflächen, kurze Antworten
FussnotenBelege am Ende der AntwortLängere, dokumentartige Ausgaben
Quellen-PanelSeparate Liste anklickbarer DokumenteSuch- und Wissensportale
HervorhebungMarkierte Textstelle im OriginaldokumentCompliance, juristische Prüfung

Typische Fehler bei Citations

  • Citations nur «erfinden» lassen: Wird die Quelle nicht aus echten Kennungen abgeleitet, halluziniert das Modell auch die Belege. Die IDs müssen aus dem realen Kontext stammen.
  • Kein Fallback: Ohne No-Answer-Gate erfindet das System auch dann eine Antwort, wenn keine passende Quelle existiert.
  • Zu grobe Granularität: Verweist eine Citation auf ein 50-seitiges PDF statt auf den konkreten Abschnitt, ist sie kaum überprüfbar. Hier hilft sauberes Chunking.
  • Citations nicht prüfbar dargestellt: Belege ohne Link oder Vorschau zwingen den Nutzer zum manuellen Suchen und untergraben den Vertrauensgewinn.

Citations und Evaluation

Citations sind auch ein Messinstrument. In der RAG-Evaluation prüft man etwa die Faithfulness (Stützt die zitierte Quelle die Aussage wirklich?) und die Citation Accuracy (Verweist die Antwort auf die richtige Quelle?). Sinkende Werte bei diesen Metriken deuten oft auf Probleme beim Retrieval oder zu grosse Chunks hin.

Praxisbeispiel: Support-Portal

Ein Kundenportal beantwortet Fragen aus Hunderten Handbuchseiten. Durch Citations sieht der Nutzer zu jeder Aussage den exakten Handbuchabschnitt und kann ihn mit einem Klick öffnen. Stützt sich eine Antwort plötzlich nicht mehr auf eine Quelle, schlägt das No-Answer-Gate an – das Portal antwortet ehrlich, dass keine belegbare Information vorliegt, statt zu raten.

[!TIP] Sie möchten erleben, wie belegte Antworten mit nachvollziehbaren Quellen in der Praxis aussehen? Probieren Sie die RAG-Demo auf allerate.dev und verfolgen Sie jede Aussage bis zur Originalquelle.

Fazit

Citations machen aus überzeugend klingenden Antworten überprüfbare Aussagen. Sie sind technisch nicht aufwändig, aber entscheidend für Vertrauen, Fehlererkennung und den produktiven Einsatz von RAG. In Kombination mit einem No-Answer-Gate bilden sie die Grundlage für ehrliche, belastbare KI-Antworten.

Häufig gestellte Fragen (FAQ)

Warum sind Citations in RAG-Systemen wichtig?

Citations machen Antworten überprüfbar. Nutzer können nachvollziehen, aus welchem Dokument eine Aussage stammt, und so Halluzinationen erkennen. Gerade in regulierten Bereichen wie Recht, Medizin oder Finanzen sind nachvollziehbare Quellen oft eine Voraussetzung für den produktiven Einsatz.

Wie werden Citations technisch erzeugt?

Jedem abgerufenen Chunk wird eine eindeutige Kennung (z. B. Dokument-ID und Abschnitt) mitgegeben. Das Modell wird angewiesen, jede Aussage mit der passenden Kennung zu belegen. Die Anwendung löst diese Kennungen anschliessend in anklickbare Quellenlinks auf.

Was tun, wenn keine Quelle passt?

Dann sollte das System keine Antwort erfinden, sondern über ein No-Answer-Gate signalisieren, dass keine belegbare Information vorliegt. Eine ehrliche «Ich weiss es nicht»-Antwort ist wertvoller als eine unbelegte Behauptung.