n8n ile şirkete özgü verilerini bilen bir chatbot kurmak, hazır AI araçlarının sunduğundan çok daha güçlü ve özelleştirilebilir bir sonuç verir. Bu rehberde RAG (Retrieval-Augmented Generation) mimarisini, vektör veritabanı entegrasyonunu ve konuşma belleği sistemini n8n üzerinden nasıl kuracağınızı adım adım açıklıyoruz.

Neden sadece ChatGPT yetmez

ChatGPT genel bilgiye sahiptir ama şirketinizin ürün kataloğunu, müşteri politikalarını veya dahili prosedür dokümanlarını bilmez. Bu bilgileri her sohbette manuel olarak yapıştırmak güvenilir ve ölçeklenebilir değildir. RAG (Retrieval-Augmented Generation) bu sorunu çözer: kullanıcı soru sorduğunda sistem önce kendi veritabanınızdan ilgili bilgi parçalarını getirir, ardından bu bilgileri modele bağlam olarak iletir.

Sonuç, şirketinizin belgelerini kaynakça göstererek yanıtlayan, güncel veriye dayalı ve kontrol edilebilir bir chatbottur. Modelin “hayal ettiği” bilgi yerine gerçek şirket verisinden üretilmiş yanıtlar gelir.

Mimarinin genel yapısı

RAG tabanlı bir n8n chatbotu dört ana bileşenden oluşur. Birincisi belge işleme pipeline’ıdır: dokümanlarınız (PDF, Word, web sayfaları) parçalara ayrılır (chunking) ve her parça matematiksel bir vektöre dönüştürülür. İkincisi vektör veritabanıdır: bu vektörler bir veritabanında saklanır ve semantik arama için kullanılır. Üçüncüsü sorgulama flowu’dur: kullanıcı sorusu vektöre dönüştürülür, en yakın belgeler aranır ve model bu belgelerle yanıt üretir. Dördüncüsü bellek sistemidir: önceki konuşmalar saklanır ve bağlamsal süreklilik sağlanır.

n8n bu dört bileşeni tek bir görsel workflow içinde birleştirir.

Vektör veritabanı seçimi

n8n, birden fazla vektör veritabanıyla entegrasyon sunar. Başlamak için en pratik seçenekler şunlardır.

Supabase pgvector, PostgreSQL’in vektör uzantısıdır. Eğer Supabase zaten kullanıyorsanız ayrı bir servis kurmadan devreye alınabilir. Ücretsiz katmanı başlangıç için yeterlidir.

Pinecone, yönetilen bir vektör veritabanı servisidir. Kurulum gerektirmez, API üzerinden çalışır ve n8n’in yerleşik Pinecone node’u entegrasyonu basitleştirir.

Qdrant ise self-hosted bir seçenektir. Verilerin kendi altyapınızda kalmasını istiyorsanız, Docker ile kolayca kurulur ve üretim ortamı için güçlü bir seçenektir.

Belge yükleme workflow’unu kurmak

n8n’de belge yükleme işlemi için ayrı bir workflow oluşturulur. Bu workflow tetiklendiğinde şu adımlar gerçekleşir.

  1. Kaynak dosyayı okur (Google Drive, yerel dosya, web URL veya S3 bucket’ı olabilir).
  2. Metni mantıklı parçalara böler. Optimal parça boyutu çoğu uygulama için 500-1000 token arasındadır.
  3. Her parçayı bir embedding modeline gönderir. OpenAI text-embedding-3-small veya Cohere embed modelleri n8n’de doğrudan kullanılabilir.
  4. Oluşturulan vektörleri metadata (dosya adı, kaynak URL, tarih) ile birlikte vektör veritabanına kaydeder.

n8n’nin bu işlem için kullandığı düğümler: Document Loader, Text Splitter, Embeddings ve Vector Store Insert.

Sorgulama ve yanıt üretme workflow’unu kurmak

Ana chatbot workflow’u kullanıcının soru gönderdiği her tetiklemeyle başlar. Workflow şu düğümleri içerir:

Webhook düğümü: Kullanıcıdan HTTP POST üzerinden sorgu alır. Bu webhook’a Slack, web sitesi veya başka bir uygulama bağlanabilir.

Embeddings düğümü: Gelen soru metni vektöre dönüştürülür.

Vector Store Query düğümü: Vektör veritabanında bu soruya en yakın 3-5 belge parçası aranır. Bu parçalar cosine similarity gibi bir ölçütle sıralanır.

AI Agent veya LLM düğümü: Bulunan belgeler sistem mesajına eklenir ve model yanıtı üretir. Sistem mesajı şu şekilde yapılandırılır:

Sen [Şirket adı] müşteri destek asistanısın.

Yalnızca aşağıdaki kaynak belgelerine dayanarak yanıt ver.

Belgede bulunmayan bir soruya "Bu konuda bilgim bulunmuyor" de.

KAYNAKLAR:

{retrieved_documents}

Konuşma belleği nasıl eklenir?

Tek soruluk bir chatbot çoğu iş senaryosu için yeterli değildir. Kullanıcı “Bahsettiğin ürünün fiyatı ne kadar?” gibi bir soru sorduğunda hangi üründen söz ettiğini sistem bilmelidir.

n8n’de konuşma belleği için Buffer Memory düğümü kullanılır. Bu düğüm önceki konuşma geçmişini saklar ve her yeni sorguda geçmişi bağlam olarak modele iletir.

Konuşma geçmişinin nerede saklanacağına karar vermeniz gerekir. Kısa oturumlar için n8n’nin dahili belleği yeterlidir. Uzun süreli kullanım veya çok kullanıcılı ortamlar için Redis (Upstash ücretsiz katmanı idealdir) veya PostgreSQL tercih edilir.

Kullanıcı bazlı bellek yönetimi için her konuşmaya benzersiz bir session ID atanır ve bu ID ile geçmiş kayıtları birbirinden ayrılır.

Bu mimarinin detaylarını ve kurumsal senaryolarda nasıl ölçekleneceğini öğrenmek isteyenler için N8N ile Yapay Zeka Destekli Workflow Otomasyonu ve Agent Geliştirme Eğitimi programı n8n’nin AI katmanını baştan sona ele alıyor.

Performansı etkileyen faktörler nelerdir?

Chatbotun yanıt kalitesi üç faktörden doğrudan etkilenir. Birincisi chunk boyutudur: çok küçük parçalar bağlamı kaybeder, çok büyük parçalar ilgisiz bilgi getirir. 800 token civarı birçok kurum için iyi bir başlangıç noktasıdır.

İkincisi kaç belge getirileceğidir (top-k): fazla belge modelin bağlamını doldurup odağını dağıtabilir, az belge ise gerekli bilgiyi atlayabilir. Başlangıç için k=3-5 denenmesi önerilir.

Üçüncüsü embedding modelidir: embedding kalitesi doğrudan arama doğruluğunu etkiler. OpenAI’ın text-embedding-3-small modeli maliyet-performans dengesi açısından 2026 itibarıyla yaygın tercih edilen seçenekler arasındadır.

Hangi veri kaynaklarını bağlayabilirsiniz?

n8n’nin hazır node kütüphanesi sayesinde şu kaynaklar vektör veritabanına beslenebilir: Google Drive belgeler ve Slides, Notion sayfaları, Confluence wiki, web sitesi sayfaları (URL crawling ile), PDF ve Word dosyaları, ve Zendesk ya da Freshdesk gibi destek sistemi içerikleri.

Bu çeşitlilik, bir şirkete özgü bilgi tabanının tüm dağınık kaynaklardan tek bir çatı altında toplanmasını mümkün kılar.

Eğer karmaşık, çok adımlı görevler de yaptırmak istiyorsanız;

RAG chatbotu soruları yanıtlar ama aksiyonlar almaz. Kullanıcının “Sipariş oluştur”, “CRM’de kayıt güncelle” veya “Ekibe bildirim gönder” gibi görevleri de chatbot aracılığıyla yapmasını istiyorsanız, bu mimari bir AI Agent mimarisine genişletilir.

AI Agent Geliştirme ve Kullanma Eğitimi programında bu geçiş, tool calling ve ajan mimarisi detaylarıyla anlatılıyor.

n8n’de RAG sistemini kurmaktan çok ajanlı workflow otomasyonuna kadar yapay zeka destekli süreçleri sıfırdan oluşturmayı öğrenmek için N8N ile Yapay Zeka Destekli Workflow Otomasyonu ve Agent Geliştirme Eğitimi programına göz atabilirsiniz.