Vector Database
Spezialisierte Datenbank zur Speicherung und effizienten Suche von Embedding-Vektoren — die zentrale Komponente in RAG-Systemen.
Vector Databases sind für die Speicherung und Abfrage hochdimensionaler Vektoren optimiert. Im Gegensatz zu klassischen Datenbanken ermöglichen sie Similarity Search: Finde die Datensätze, die einem gegebenen Vektor am ähnlichsten sind. Bekannte Lösungen sind Pinecone, Weaviate, Qdrant, Milvus und pgvector (PostgreSQL-Erweiterung).
Wie funktioniert eine Vector Database?
Eine Vector Database speichert Embeddings — numerische Repräsentationen von Texten, Bildern oder anderen Daten in einem hochdimensionalen Raum. Wenn ein Nutzer eine Frage stellt, wird diese ebenfalls in einen Vektor umgewandelt und die Datenbank sucht die ähnlichsten gespeicherten Vektoren. Diese Ähnlichkeitssuche basiert auf mathematischen Distanzmetriken wie Cosine Similarity oder Euclidean Distance.
Der entscheidende Unterschied zu relationalen Datenbanken liegt in der Indexierung. Während SQL-Datenbanken exakte Treffer über B-Tree-Indizes finden, nutzen Vector Databases sogenannte Approximate Nearest Neighbor (ANN) Algorithmen wie HNSW (Hierarchical Navigable Small World) oder IVF (Inverted File Index). Diese liefern Ergebnisse in Millisekunden, auch bei Millionen von Vektoren — auf Kosten einer minimalen Ungenauigkeit, die in der Praxis kaum relevant ist.
Vector Databases im RAG-Kontext
In einem RAG-System bildet die Vector Database das Herzstück der Retrieval-Komponente. Unternehmensdokumente werden in Chunks zerlegt, durch ein Embedding-Modell in Vektoren umgewandelt und in der Datenbank gespeichert. Bei einer Nutzeranfrage werden die semantisch relevantesten Chunks abgerufen und dem LLM als Kontext übergeben. Die Qualität der Antworten hängt direkt von der Qualität des Retrievals ab — und damit von der richtigen Konfiguration der Vector Database.
Wichtige Stellschrauben sind dabei die Chunk-Größe, die Wahl des Embedding-Modells und die Metadaten-Filterung. In der Praxis zeigt sich, dass eine rein semantische Suche allein oft nicht ausreicht. Hybrid Search — die Kombination aus semantischer Vektorsuche und klassischer Keyword-Suche (BM25) — liefert deutlich bessere Ergebnisse, insbesondere bei Fachbegriffen und Eigennamen.
Auswahl der richtigen Vector Database
| Lösung | Typ | Stärken | Geeignet für |
|---|---|---|---|
| pgvector | PostgreSQL-Erweiterung | Bestehende Infrastruktur nutzen, SQL-kompatibel | Einstieg, kleinere Datenmengen |
| Weaviate | Dedizierte DB | Hybrid Search, GraphQL-API, Multitenancy | Produktionssysteme mit Hybrid Search |
| Qdrant | Dedizierte DB | Hohe Performance, Rust-basiert, Filterfunktionen | Performance-kritische Anwendungen |
| Milvus | Dedizierte DB | Skalierung auf Milliarden Vektoren, GPU-Support | Große Datenmengen, Enterprise |
| Chroma | Embedded DB | Einfache Integration, Python-nativ | Prototyping, lokale Entwicklung |
Für den Einstieg und bei bestehender PostgreSQL-Infrastruktur ist pgvector oft die pragmatischste Wahl. Für produktionsreife Systeme mit Hybrid Search empfehlen sich dedizierte Lösungen wie Weaviate oder Qdrant. Bei sehr großen Datenmengen bietet Milvus die beste Skalierung.
Datensouveränität und Hosting
Für deutsche Unternehmen ist die Frage des Hostings zentral. Bei Managed-Cloud-Angeboten ist die Region der Datenspeicherung sorgfältig zu prüfen — nicht alle Anbieter garantieren EU-Hosting, und die Standardkonfiguration nutzt häufig US-Rechenzentren. Self-hosted Lösungen wie Qdrant, Weaviate oder Milvus lassen sich auf eigener Infrastruktur oder bei DSGVO-konformen europäischen Cloud-Anbietern betreiben. Gerade für Unternehmen, die sensible interne Dokumente in einer KI-Wissensdatenbank erschließen möchten, ist die volle Kontrolle über den Speicherort der Vektoren und Metadaten unverzichtbar.
Relevanz für KMUs
Vector Databases sind keine reine Enterprise-Technologie mehr. Mit pgvector kann jedes Unternehmen, das bereits PostgreSQL einsetzt, ohne zusätzliche Infrastruktur eine semantische Suche aufbauen. Der typische Einstieg im Mittelstand ist eine interne Wissensdatenbank, die Handbücher, Prozessdokumentation oder Kundenanfragen durchsuchbar macht — weit über das hinaus, was eine klassische Volltextsuche leisten kann.