Reranking

Abkürzungen / Synonyme: Neubewertung

Kurzdefinition

Der Prozess, bei dem abgerufene Dokumente durch ein zweites, präziseres Modell neu bewertet und sortiert werden.

Ausführliche Erklärung

Reranking ist ein zweistufiger Suchansatz: Zuerst liefert die schnelle Vektorsuche (Bi-Encoder) viele Kandidaten, danach bewertet ein präziserer Cross-Encoder die Top-Kandidaten erneut und sortiert sie nach echter Relevanz. Der Cross-Encoder analysiert Frage und Dokument gemeinsam und erkennt feine Bedeutungsunterschiede, die die reine Vektorähnlichkeit übersieht. Reranking verbessert die Präzision der obersten Treffer deutlich und ist besonders dann wertvoll, wenn nur wenige Chunks ins Kontextfenster passen.

Beispiel

Die Vektorsuche liefert 50 Kandidaten; ein Cross-Encoder-Reranker bewertet diese neu und wählt die besten 5 aus, die dann als Kontext an das LLM übergeben werden.

Vertiefender Fachartikel

Im ausführlichen Fachartikel erklären wir Reranking mit Architektur, Praxisbeispielen und Best Practices im Detail:

Fachartikel zu Reranking aufrufen