Which embedding model to use?

OpenAI text-embedding-3-large for max quality ($0.13/1M tokens). Voyage-large-2 for multilingual (native Romanian). For min cost: text-embedding-3-small ($0.02/1M).

Pinecone: cloud-only, easy, expensive. Qdrant: open-source, self-hosted, free, more flexible. For SMB: Qdrant. For enterprise without ops: Pinecone.

Can I use Postgres as vector DB?

Yes, with pgvector extension. Good performance up to ~1M vectors. Above that, Pinecone/Qdrant win significantly in speed.

Vector dimensions - 384, 1024, 1536? What's the difference?

More dimensions = more info, more precise, but more expensive (storage + compute). 384 is enough for general semantic search. 1536 (OpenAI default) for demanding cases.

Vector Database: Definition + Use Cases | DevoneX AI Glossary

Vector Database (bază de date vectorială)

Bază de date specializată în stocarea și căutarea vectorilor numerici (embeddings) - esențială pentru RAG, recomandări AI, căutare semantică.

Ce face un vector database

Diferit de bazele de date clasice (SQL care caută după ID, MongoDB care caută după chei), un vector database e optimizat pentru căutare după similaritate semantică. Stochează vectori numerici (embeddings) cu sute sau mii de dimensiuni și răspunde rapid la query-uri "găsește cele mai apropiate 10 înregistrări de acest vector".

De ce ai nevoie de el

Embeddings sunt reprezentări numerice ale conținutului (text, imagini, audio) care capturează sensul. Două propoziții sinonime au vectori apropiați. Asta îți permite căutare semantică ("aspirator" găsește și "vacuum cleaner" și "robot de aspirat") - ceva imposibil cu SQL clasic.

Opțiuni populare în 2026

Pinecone: cel mai popular cloud, scalabil, scump la volum mare ($70-1000+/lună).
Qdrant: open-source, self-hostable, performanță excelentă, free.
Supabase pgvector: built-in Postgres extension, perfect pentru proiecte care deja au Supabase. Free tier generos.
Weaviate: cloud + self-hosted, hybrid search avansat.
Milvus: enterprise-grade, scalabil pentru miliarde de vectori.

Aplicații concrete

RAG pentru chatbot AI - cea mai comună utilizare
Recomandări produse pe e-commerce ("clienți ca tine au mai cumpărat...")
Căutare semantică în documentație internă
Detectare de fraude și anomalii
Image similarity search (găsește imagini similare)
Recomandare conținut (videoclipuri, articole)

Costuri tipice

Pentru SMB: Supabase pgvector free tier acoperă până la 100k-500k vectori. Peste asta: Pinecone $70/lună starter sau Qdrant self-hosted pe Hetzner $10/lună. Pentru enterprise (1M+ vectori): $200-2000/lună.

Întrebări frecvente

Ce embedding model să folosesc?

OpenAI text-embedding-3-large pentru calitate maximă ($0.13/1M tokens). Voyage-large-2 pentru multilingv (română nativ). Pentru cost minim: text-embedding-3-small ($0.02/1M).

Pinecone vs Qdrant?

Pinecone: cloud-only, ușor, scump. Qdrant: open-source, self-hosted, gratis, mai flexibil. Pentru SMB: Qdrant. Pentru enterprise care nu vrea ops: Pinecone.

Pot folosi Postgres ca vector DB?

Da, cu extension pgvector. Performanță bună până la ~1M vectori. Peste, Pinecone/Qdrant câștigă semnificativ în viteză.

Vectorii dimensiuni - 384, 1024, 1536? Ce diferență?

Mai multe dimensiuni = mai multă informație, mai precis, dar mai scump (storage + compute). 384 e suficient pentru semantic search general. 1536 (OpenAI default) pentru cazuri exigente.