Cosine Similarity

Abkürzungen / Synonyme: Kosinus-Ähnlichkeit

Kurzdefinition

Ein Mass für die Ähnlichkeit zweier Vektoren, das den Kosinus des Winkels zwischen ihnen im Vektorraum berechnet.

Ausführliche Erklärung

Die Cosine Similarity misst, wie ähnlich sich zwei Vektoren in ihrer Richtung sind, unabhängig von ihrer Länge. Der Wert liegt zwischen -1 und 1: 1 bedeutet identische Ausrichtung (maximale Ähnlichkeit), 0 bedeutet keinen Zusammenhang. In RAG-Systemen ist sie das Standardmass, um die Ähnlichkeit zwischen dem Embedding der Frage und den Embeddings der Dokument-Chunks zu bestimmen und so die relevantesten Treffer zu finden.

Beispiel

Die Embeddings von «Hund» und «Welpe» haben eine hohe Cosine Similarity (~0,8), «Hund» und «Aktie» dagegen eine niedrige (~0,1).

Vertiefender Fachartikel

Im ausführlichen Fachartikel erklären wir Cosine Similarity mit Architektur, Praxisbeispielen und Best Practices im Detail:

Fachartikel zu Cosine Similarity aufrufen