Bi-Encoder
Kurzdefinition
Ein Modelltyp, der Abfrage und Dokument separat in Vektoren übersetzt (wird für schnellen Abruf in Vektordatenbanken verwendet).
Ausführliche Erklärung
Ein Bi-Encoder bettet Frage und Dokumente getrennt in Vektoren ein, sodass die Dokument-Embeddings vorab berechnet und in einer Vektordatenbank gespeichert werden können. Zur Laufzeit muss nur noch die Frage eingebettet und per Ähnlichkeitssuche verglichen werden – das ist extrem schnell und skaliert auf Millionen Dokumente. Der Preis dafür ist etwas geringere Präzision als beim Cross-Encoder. Typische Pipeline: Bi-Encoder für die Vorauswahl, Cross-Encoder für das Reranking.
Beispiel
Alle Handbuch-Chunks werden einmalig per Bi-Encoder eingebettet; bei jeder Frage wird nur deren Vektor berechnet und blitzschnell gegen den Index verglichen.
Im ausführlichen Fachartikel erklären wir Bi-Encoder mit Architektur, Praxisbeispielen und Best Practices im Detail: