Ga naar inhoud
Technologie

Wat is Vector-database?

Een vector-database is een database die is geoptimaliseerd voor het opslaan en doorzoeken van embeddings — numerieke representaties van tekst, beelden of andere data. Vector-databases vormen de ruggegraat van moderne AI-toepassingen met retrieval-augmented generation, omdat ze in milliseconden kunnen vinden welke documenten semantisch het meest lijken op een zoekopdracht, ongeacht exacte woordkeuze.

Verschil met een gewone database

Een klassieke database zoekt op exacte matches of via SQL-filters. Een vector-database zoekt op nabijheid: gegeven een query-vector, welke opgeslagen vectoren liggen er het dichtst bij? Dit maakt semantisch zoeken mogelijk — "hoe annuleer ik mijn abonnement" en "kan ik opzeggen" leveren dezelfde resultaten op.

Hoe embeddings ontstaan

Een embeddings-model (bijvoorbeeld OpenAI text-embedding-3) zet een stuk tekst om in een vector van honderden tot duizenden getallen. Vergelijkbare teksten krijgen vergelijkbare vectoren. Door deze vectoren in een vector-database op te slaan, kun je snel zoeken op betekenis.

Kern-feiten

Vector-database in vijf punten

  • Slaat embeddings op (numerieke vectoren van betekenis)
  • Zoekt op semantische nabijheid, niet op exacte match
  • Bekende implementaties: pgvector, Pinecone, Weaviate, Chroma, Qdrant
  • Vector-dimensies typisch 384, 768, 1536 of 3072
  • Essentieel voor RAG-gebaseerde AI-chatbots
Veelgestelde vragen

Veelgestelde vragen over Vector-database

Welke vector-database is het beste voor een chatbot?

Voor MKB-schaal (tot ~1M documenten) is pgvector op Postgres een uitstekende keuze: simpel, goedkoop, eenvoudig te integreren. Voor enterprise schaal (10M+ vectoren met hoge concurrency) zijn Pinecone of Qdrant geschikter. Denkchat draait op pgvector via Supabase.

Wat kost een vector-database?

pgvector is gratis (open source). Managed varianten zoals Supabase beginnen rond €0-€25/m. Cloud-native vector-DBs zoals Pinecone starten rond $70/m voor productie-gebruik.

Hoeveel data kan een vector-database aan?

pgvector schaalt tot enkele miljoenen vectoren op standaard hardware. Voor 100M+ vectoren zijn gedistribueerde oplossingen zoals Pinecone, Weaviate of Milvus beter geschikt. Voor de meeste MKB-chatbots is dit nooit een probleem.

Vervangt een vector-database mijn normale database?

Nee — ze hebben verschillende doelen. Een gewone database (Postgres, MySQL) voor structured data en transacties. Een vector-database voor semantisch zoeken. In de praktijk gebruik je vaak beide naast elkaar (of pgvector dat allebei kan).

Klaar om zelf vector-database in te zetten?

Bouw een AI-chatbot getraind op jouw eigen content. Gratis starten, geen creditcard.