Hybrid Search im RAG: Kombination aus Stichwort- und Vektorsuche
Die Hybrid-Suche (Hybrid Search) ist ein hochentwickeltes Suchverfahren in RAG-Systemen, das die Stärken der klassischen Stichwortsuche (lexikalische Suche, z. B. BM25) mit den Vorteilen der Vektorsuche (semantische Suche) kombiniert. Durch diese Fusion werden sowohl inhaltliche Konzepte als auch exakte Suchbegriffe, Eigennamen oder Seriennummern verlässlich in den Quelldokumenten gefunden. Sie ist damit ein zentraler Baustein einer robusten RAG-Architektur.
Warum reicht eine der beiden Suchmethoden nicht aus?
Sowohl die reine Vektorsuche als auch die klassische Stichwortsuche weisen spezifische Schwachstellen auf:
- Das Problem der reinen Vektorsuche (Dense Retrieval): Da Texte in abstrakte Konzepte übersetzt werden, tut sich die Vektorsuche schwer mit exakten Begriffen. Sucht ein Support-Mitarbeiter nach dem Fehlercode „ERR-902“, liefert die Vektorsuche eventuell andere allgemeine Fehlermeldungen, findet aber nicht das Dokument mit diesem exakten Code.
- Das Problem der reinen Stichwortsuche (Sparse Retrieval / z. B. BM25): Sie versteht keine Synonyme oder grammatikalischen Abweichungen. Sucht ein Kunde nach „Kabellose Kopfhörer“, geht ein Dokument leer aus, in dem ausschliesslich von „Bluetooth-Earbuds“ geschrieben wird.
Funktionsweise der Hybrid-Suche
Die Hybrid-Suche führt bei einer Suchanfrage zwei Abfragen parallel aus:
┌──────────────────────┐
│ Benutzer-Suchanfrage │
└──────────┬───────────┘
┌──────────────┴──────────────┐
▼ ▼
┌────────────────────┐ ┌────────────────────┐
│ Stichwortsuche │ │ Vektorsuche │
│ (z. B. BM25) │ │ (Kosinus-Ähnlichk.)│
└──────────┬─────────┘ └──────────┬─────────┘
│ │
└──────────────┬──────────────┘
▼
┌───────────────────────────┐
│ Reciprocal Rank Fusion │
│ (RRF) / Zusammenführung │
└─────────────┬─────────────┘
▼
┌───────────────────────────┐
│ Finale Dokumentenliste │
└───────────────────────────┘
- Lexikalischer Zweig: Berechnet den Relevanz-Score basierend auf Algorithmen wie BM25, die die Termhäufigkeit und Dokumentenlänge bewerten.
- Semantischer Zweig: Berechnet die Kosinus-Ähnlichkeit im hochdimensionalen Vektorraum unter Verwendung von Embeddings.
- Die Fusion: Da die Roh-Scores beider Suchen (z. B. ein BM25-Wert von
14.2und ein Kosinus-Wert von0.82) mathematisch nicht vergleichbar sind, müssen die Listen normalisiert zusammengeführt werden.
Das Zusammenführen: Reciprocal Rank Fusion (RRF)
Der führende Standard zur Zusammenführung ist die Reciprocal Rank Fusion (RRF). RRF bewertet die Relevanz eines Dokuments ausschliesslich anhand seiner Position (Rang) in den beiden Ergebnislisten.
Die RRF-Formel für ein Dokument $d$ lautet:
$$RRF_Score(d) = \sum_{m \in M} \frac{1}{k + r_m(d)}$$
- $M$ ist die Menge der Suchen (Stichwort und Vektor).
- $r_m(d)$ ist der Rang (Platzierung) des Dokuments in der Suche $m$ (z. B. $r=1$ für den ersten Platz).
- $k$ is eine Konstante (standardmässig $60$), die verhindert, dass sehr niedrig platzierte Dokumente das Gesamtergebnis zu stark verzerren.
Ein Dokument, das in beiden Suchen auf den vorderen Plätzen landet, erhält einen extrem hohen RRF-Score und wird ganz oben gelistet. Steht ein Dokument in der Vektorsuche auf Platz 2 und in der Stichwortsuche auf Platz 150, wird es durch den RRF-Score fair gewichtet und bleibt in den Top-Ergebnissen sichtbar.
Vorteile für Unternehmen
- Höhere Trefferquote (Recall): Reduziert das Risiko, dass die Firmen-KI wichtige Dokumente übersieht.
- Fehlertoleranz: Versteht sowohl Tippfehler und Umschreibungen (über Vektoren) als auch Fachbegriffe und Produkt-IDs (über BM25).
- Investitionsschutz: Bestehende Datenbanken (wie PostgreSQL) können durch geschickte Queries direkt als Hybrid-Search-Engine genutzt werden.
Wann welche Suche gewinnt: ein direkter Vergleich
Die folgende Tabelle zeigt anhand typischer Anfragen, warum erst die Kombination beider Verfahren zuverlässig liefert:
| Anfrage-Typ | Reine Vektorsuche | Reine Stichwortsuche (BM25) | Hybrid Search |
|---|---|---|---|
| Fehlercode «ERR-902» | Schwach (kein exakter Treffer) | Stark | Stark |
| «Kabellose Kopfhörer» → «Bluetooth-Earbuds» | Stark (Synonym) | Schwach | Stark |
| Produkt-ID «SKU-4471-B» | Schwach | Stark | Stark |
| «Wie kündige ich mein Abo?» | Stark | Mittel | Stark |
| Tippfehler «Vertarg» statt «Vertrag» | Mittel | Schwach | Mittel–Stark |
Während jede Einzelmethode mindestens eine Schwachstelle hat, deckt die Hybrid-Suche sämtliche Anfragetypen verlässlich ab.
Praxisbeispiel: RRF Schritt für Schritt
Angenommen, eine Suchanfrage liefert in beiden Zweigen folgende Ränge für drei Dokumente (mit der Standardkonstante k = 60):
| Dokument | Rang Vektorsuche | Rang BM25 | RRF-Score |
|---|---|---|---|
| Dok A | 1 | 3 | 1/61 + 1/63 = 0.0323 |
| Dok B | 2 | 1 | 1/62 + 1/61 = 0.0325 |
| Dok C | 50 | 2 | 1/110 + 1/62 = 0.0252 |
Obwohl Dok A in der Vektorsuche auf Platz 1 liegt, gewinnt Dok B, weil es in beiden Listen konstant weit oben steht. Dok C profitiert vom guten BM25-Rang und bleibt trotz schwacher Vektorposition unter den Top-Ergebnissen – genau dieses ausgleichende Verhalten macht RRF so robust.
Hybrid Search und Reranking kombinieren
Hybrid Search und Reranking sind keine Alternativen, sondern zwei aufeinanderfolgende Stufen:
- Stufe 1 – Recall maximieren: Hybrid Search holt aus Millionen Dokumenten eine breite Kandidatenliste (z. B. Top 50), die sowohl semantisch als auch lexikalisch passende Treffer enthält.
- Stufe 2 – Precision maximieren: Ein Cross-Encoder bewertet diese Kandidaten gemeinsam mit der Frage und sortiert die besten 3–5 Chunks nach oben – erst diese landen im Kontextfenster des Sprachmodells.
So verbindet die Pipeline die hohe Trefferquote der Hybrid-Suche mit der Präzision des Rerankers – die Grundlage für belastbare Quellenangaben.
[!TIP] Die Hybrid-Suche maximiert die Zuverlässigkeit von RAG-Systemen im B2B-Umfeld. Erleben Sie die Präzision der Hybrid-Suche live in der RAG-Demo auf allerate.dev.
Häufig gestellte Fragen (FAQ)
Was bedeutet RRF (Reciprocal Rank Fusion)?
RRF ist ein Algorithmus zum Zusammenführen verschiedener Ergebnislisten. Er bewertet Dokumente danach, wie weit oben sie in der jeweiligen Suche (z. B. Platz 1 bei Stichwortsuche, Platz 5 bei Vektorsuche) stehen, ohne die inkompatiblen Roh-Scores direkt vergleichen zu müssen.
Benötigt Hybrid Search zwei getrennte Datenbanken?
In der Regel nein. Moderne Vektordatenbanken (wie Qdrant, Milvus oder Elasticsearch) und relationale Erweiterungen (wie pgvector für PostgreSQL) können sowohl lexikalische als auch Vektorsuchen in einem einzigen System ausführen.
Soll ich Hybrid Search mit einem Reranker kombinieren?
Ja, das ist die stärkste Kombination. Hybrid Search maximiert zuerst die Trefferquote (Recall), indem es semantisch und lexikalisch passende Kandidaten findet. Ein nachgeschalteter Reranker (Cross-Encoder) sortiert diese Kandidaten anschliessend präzise nach Relevanz und steigert so die Genauigkeit (Precision) der Top-Ergebnisse.
Wie gewichtet man die lexikalische und die semantische Suche?
Bei RRF ist keine manuelle Gewichtung nötig, da nur die Ränge zählen. Wer stattdessen die normalisierten Roh-Scores linear kombiniert (Convex Combination), nutzt einen Alpha-Wert zwischen 0 und 1: Ein höheres Alpha betont die Vektorsuche, ein niedrigeres die Stichwortsuche. Der optimale Wert wird über eine Evaluation mit echten Testfragen ermittelt.