pgvector
Kurzdefinition
Eine Open-Source-Erweiterung für PostgreSQL, die das Speichern und effiziente Durchsuchen von Vektoren ermöglicht.
Ausführliche Erklärung
pgvector ist eine Open-Source-Erweiterung, die PostgreSQL um einen Vektor-Datentyp und Ähnlichkeitssuche erweitert. Der grosse Vorteil: Man muss keine separate Vektordatenbank betreiben, sondern speichert Embeddings direkt neben den relationalen Daten – das vereinfacht Joins (z. B. mit Benutzerrechten für Mandantentrennung), Backups und Betrieb. pgvector unterstützt Indizes wie HNSW und IVFFlat für schnelle Suche und ist eine beliebte Basis für RAG-Systeme im Java-/Spring-Umfeld.
Beispiel
Mit `CREATE EXTENSION vector;` und einer Spalte vom Typ `vector(1536)` speichert man Embeddings direkt in PostgreSQL und sucht per `ORDER BY embedding <=> query`.
Im ausführlichen Fachartikel erklären wir pgvector mit Architektur, Praxisbeispielen und Best Practices im Detail: