Înapoi la glosarAI Foundations

Vector Database (bază de date vectorială)

Bază de date specializată în stocarea și căutarea vectorilor numerici (embeddings) - esențială pentru RAG, recomandări AI, căutare semantică.

Ce face un vector database

Diferit de bazele de date clasice (SQL care caută după ID, MongoDB care caută după chei), un vector database e optimizat pentru căutare după similaritate semantică. Stochează vectori numerici (embeddings) cu sute sau mii de dimensiuni și răspunde rapid la query-uri "găsește cele mai apropiate 10 înregistrări de acest vector".

De ce ai nevoie de el

Embeddings sunt reprezentări numerice ale conținutului (text, imagini, audio) care capturează sensul. Două propoziții sinonime au vectori apropiați. Asta îți permite căutare semantică ("aspirator" găsește și "vacuum cleaner" și "robot de aspirat") - ceva imposibil cu SQL clasic.

Opțiuni populare în 2026

  • Pinecone: cel mai popular cloud, scalabil, scump la volum mare ($70-1000+/lună).
  • Qdrant: open-source, self-hostable, performanță excelentă, free.
  • Supabase pgvector: built-in Postgres extension, perfect pentru proiecte care deja au Supabase. Free tier generos.
  • Weaviate: cloud + self-hosted, hybrid search avansat.
  • Milvus: enterprise-grade, scalabil pentru miliarde de vectori.

Aplicații concrete

  • RAG pentru chatbot AI - cea mai comună utilizare
  • Recomandări produse pe e-commerce ("clienți ca tine au mai cumpărat...")
  • Căutare semantică în documentație internă
  • Detectare de fraude și anomalii
  • Image similarity search (găsește imagini similare)
  • Recomandare conținut (videoclipuri, articole)

Costuri tipice

Pentru SMB: Supabase pgvector free tier acoperă până la 100k-500k vectori. Peste asta: Pinecone $70/lună starter sau Qdrant self-hosted pe Hetzner $10/lună. Pentru enterprise (1M+ vectori): $200-2000/lună.

Întrebări frecvente

Ce embedding model să folosesc?

+
OpenAI text-embedding-3-large pentru calitate maximă ($0.13/1M tokens). Voyage-large-2 pentru multilingv (română nativ). Pentru cost minim: text-embedding-3-small ($0.02/1M).

Pinecone vs Qdrant?

+
Pinecone: cloud-only, ușor, scump. Qdrant: open-source, self-hosted, gratis, mai flexibil. Pentru SMB: Qdrant. Pentru enterprise care nu vrea ops: Pinecone.

Pot folosi Postgres ca vector DB?

+
Da, cu extension pgvector. Performanță bună până la ~1M vectori. Peste, Pinecone/Qdrant câștigă semnificativ în viteză.

Vectorii dimensiuni - 384, 1024, 1536? Ce diferență?

+
Mai multe dimensiuni = mai multă informație, mai precis, dar mai scump (storage + compute). 384 e suficient pentru semantic search general. 1536 (OpenAI default) pentru cazuri exigente.

Termeni înrudiți

Vrei să implementezi în afacerea ta?

Programează o discuție gratuită