Cosine Similarity
Abkürzungen / Synonyme: Kosinus-Ähnlichkeit
Kurzdefinition
Ein Mass für die Ähnlichkeit zweier Vektoren, das den Kosinus des Winkels zwischen ihnen im Vektorraum berechnet.
Ausführliche Erklärung
Die Cosine Similarity misst, wie ähnlich sich zwei Vektoren in ihrer Richtung sind, unabhängig von ihrer Länge. Der Wert liegt zwischen -1 und 1: 1 bedeutet identische Ausrichtung (maximale Ähnlichkeit), 0 bedeutet keinen Zusammenhang. In RAG-Systemen ist sie das Standardmass, um die Ähnlichkeit zwischen dem Embedding der Frage und den Embeddings der Dokument-Chunks zu bestimmen und so die relevantesten Treffer zu finden.
Beispiel
Die Embeddings von «Hund» und «Welpe» haben eine hohe Cosine Similarity (~0,8), «Hund» und «Aktie» dagegen eine niedrige (~0,1).
Im ausführlichen Fachartikel erklären wir Cosine Similarity mit Architektur, Praxisbeispielen und Best Practices im Detail: