Vektör Veritabanları Eğitimi

Eğitim Tipi : Sanal Sınıf / Online

Süre : 2 Gün

Anasayfa
Big Data Eğitimleri / Veritabanı Yönetimi Eğitimleri
Vektör Veritabanları Eğitimi

Açıklama

Bu eğitimin amacı; metin/görüntü gibi içeriklerden embedding (vektör) üretmeyi, bu vektörleri farklı vektör veritabanlarında saklayıp (FAISS, Chroma, PgVector, Milvus/Weaviate vb.) verimli benzerlik araması yapmayı ve RAG gibi senaryolarla bütünleştirerek üretim düzeyinde çalıştırmayı öğretmektir. Katılımcılar; parçalama (chunking), metadata şeması, indeks ve uzaklık metrikleri seçimi, hibrit arama ve kalite/performans değerlendirmelerini uygulamalı (hands-on) olarak deneyimleyeceklerdir.

Eğitim Sonu Kazanımları

Farklı içeriklerden embedding üreterek Oracle23Ai/Chroma/PgVector/Milvus gibi veritabanlarına yazma, indeksleme ve benzerlik araması kurabileceksiniz.
Doğru parçalama (chunking) ve metadata şemasıyla hibrit arama (lexical + vector) ve yeniden sıralama (re-ranking) akışlarını tasarlayabileceksiniz.
RAG entegrasyonu için geri getirme→birleştirme→değerlendirme sürecini kurup kalite ve performans iyileştirmelerini uygulayabileceksiniz.

Kimler Katılmalı

Backend ve veri mühendisleri
Arama/RAG ve doküman odaklı uygulamalar geliştiren ekipler
LLM ile benzerlik araması, semantik arama ve bilgi getirme kurmak isteyenler

Eğitim İçeriği

Vektör ve Retrieval Temelleri (Uygulamalı)

Embedding temelleri: model seçimi, boyut, normalize etme
Parçalama (chunking) ve pencereleme; başlık/hiyerarşi ilişkisi
Uzaklık metrikleri: cosine, L2, dot-product; normalize etkileri
İndeks tipleri: Flat/IVF/HNSW; parametre seçimi mantığı
Vektör DB çeşitleri: PgVector,Oracle 23ai, Chroma, PgVector, Milvus
Metadata şeması ve filtreleme; multi-tenant desenler
Hibrit arama: lexical + vector; basit re-ranking senaryosu
Hands-on: PgVector ile SQL tabanlı benzerlik araması
Kalite ölçümü: golden set, negatif örnek, precision@k/recall@k (özet)

RAG Entegrasyonu, Ölçek ve En İyi Pratikler (Uygulamalı)

RAG mimarisi: retrieve→compose; bağlam penceresi ve yanıt biçimi
Gelişmiş chunking: tablo/JSON/PDF yapıları ve alan temelli bölme
Re-ranking ve sinyal birleştirme (skorlar, MMR; özet yaklaşım)
Performans ve maliyet: batch insert, caching, latency/kalite dengesi
Gözlemlenebilirlik: sorgu logları, isabet analizi, hatalı örnek madenciliği
Güvenlik ve yönetişim: PII maskeleme, erişim/rol tabanlı filtreler
Hands-on: RAG akışı kur (retrieve→cevapla)
Hands-on: Hibrit arama + re-ranking ile kaliteyi yükselt

Ön Koşullar

Temel programlama bilgisi ve veri yapılarına aşinalık.