pgvector

Kurzdefinition

Eine Open-Source-Erweiterung für PostgreSQL, die das Speichern und effiziente Durchsuchen von Vektoren ermöglicht.

Ausführliche Erklärung

pgvector ist eine Open-Source-Erweiterung, die PostgreSQL um einen Vektor-Datentyp und Ähnlichkeitssuche erweitert. Der grosse Vorteil: Man muss keine separate Vektordatenbank betreiben, sondern speichert Embeddings direkt neben den relationalen Daten – das vereinfacht Joins (z. B. mit Benutzerrechten für Mandantentrennung), Backups und Betrieb. pgvector unterstützt Indizes wie HNSW und IVFFlat für schnelle Suche und ist eine beliebte Basis für RAG-Systeme im Java-/Spring-Umfeld.

Beispiel

Mit `CREATE EXTENSION vector;` und einer Spalte vom Typ `vector(1536)` speichert man Embeddings direkt in PostgreSQL und sucht per `ORDER BY embedding <=> query`.

Vertiefender Fachartikel

Im ausführlichen Fachartikel erklären wir pgvector mit Architektur, Praxisbeispielen und Best Practices im Detail:

Fachartikel zu pgvector aufrufen