Vektör Veritabanları Eğitimi

Eğitim Tipi : Sanal Sınıf / Online
Süre : 2 Gün
  1. Anasayfa
  2. /
  3. Vektör Veritabanları Eğitimi

Açıklama

    Bu eğitimin amacı; metin/görüntü gibi içeriklerden embedding (vektör) üretmeyi, bu vektörleri farklı vektör veritabanlarında saklayıp (FAISS, Chroma, PgVector, Milvus/Weaviate vb.) verimli benzerlik araması yapmayı ve RAG gibi senaryolarla bütünleştirerek üretim düzeyinde çalıştırmayı öğretmektir. Katılımcılar; parçalama (chunking), metadata şeması, indeks ve uzaklık metrikleri seçimi, hibrit arama ve kalite/performans değerlendirmelerini uygulamalı (hands-on) olarak deneyimleyeceklerdir.

     

    Eğitim Sonu Kazanımları

    • Farklı içeriklerden embedding üreterek Oracle23Ai/Chroma/PgVector/Milvus gibi veritabanlarına yazma, indeksleme ve benzerlik araması kurabileceksiniz.
    • Doğru parçalama (chunking) ve metadata şemasıyla hibrit arama (lexical + vector) ve yeniden sıralama (re-ranking) akışlarını tasarlayabileceksiniz.
    • RAG entegrasyonu için geri getirme→birleştirme→değerlendirme sürecini kurup kalite ve performans iyileştirmelerini uygulayabileceksiniz.

     

    Kimler Katılmalı

    • Backend ve veri mühendisleri
    • Arama/RAG ve doküman odaklı uygulamalar geliştiren ekipler
    • LLM ile benzerlik araması, semantik arama ve bilgi getirme kurmak isteyenler

Eğitim İçeriği

Vektör ve Retrieval Temelleri (Uygulamalı)

  • Embedding temelleri: model seçimi, boyut, normalize etme
  • Parçalama (chunking) ve pencereleme; başlık/hiyerarşi ilişkisi
  • Uzaklık metrikleri: cosine, L2, dot-product; normalize etkileri
  • İndeks tipleri: Flat/IVF/HNSW; parametre seçimi mantığı
  • Vektör DB çeşitleri: PgVector,Oracle 23ai, Chroma, PgVector, Milvus
  • Metadata şeması ve filtreleme; multi-tenant desenler
  • Hibrit arama: lexical + vector; basit re-ranking senaryosu
  • Hands-on: PgVector ile SQL tabanlı benzerlik araması
  • Kalite ölçümü: golden set, negatif örnek, precision@k/recall@k (özet)

RAG Entegrasyonu, Ölçek ve En İyi Pratikler (Uygulamalı)

  • RAG mimarisi: retrieve→compose; bağlam penceresi ve yanıt biçimi
  • Gelişmiş chunking: tablo/JSON/PDF yapıları ve alan temelli bölme
  • Re-ranking ve sinyal birleştirme (skorlar, MMR; özet yaklaşım)
  • Performans ve maliyet: batch insert, caching, latency/kalite dengesi
  • Gözlemlenebilirlik: sorgu logları, isabet analizi, hatalı örnek madenciliği
  • Güvenlik ve yönetişim: PII maskeleme, erişim/rol tabanlı filtreler
  • Hands-on: RAG akışı kur (retrieve→cevapla)
  • Hands-on: Hibrit arama + re-ranking ile kaliteyi yükselt

Ön Koşullar

Temel programlama bilgisi ve veri yapılarına aşinalık.