Sıfırdan RAG’a: Laravel Uygulamasında Retrieval-Augmented Generation’ı Uygulama

Son güncelleme: 3 Mart 2026 04:19

Müşteriniz için şık bir AI sohbet botunu dağıttığınızı hayal edin — soruları güvenle yanıtlıyor, kullanıcılar onu seviyor ve birisi geçen Salı gününde güncellenmiş bir şirket politikasıyla ilgili bir soru soruyor. Bot, yanıtı o kadar yanlış bir şekilde hayal ediyor ki, neredeyse bir uyum ihlaline neden oluyor. Retrieval-Augmented Generation (RAG) bu temel sorunu çözüyor ve LLM destekli özellikler geliştiren her geliştiricinin derinlemesine anlaması gereken bir konudur.

<p>Bu rehberde, belgeleri parçalayarak ve gömme (embedding) oluşturarak, bunları bir vektör veritabanında saklayarak ve her şeyi bir akış chat arayüzü ile birleştirerek çalışan bir RAG pipeline'ı oluşturacağız.</p>

<h2>
  <a name="what-rag-actually-does-and-why-it-matters" href="#what-rag-actually-does-and-why-it-matters"></a>
  RAG Nedir ve Neden Önemlidir
</h2>

<p>Büyük Dil Modelleri (LLM'ler) statik veri kümeleri üzerinde eğitilir. Ne dün ne de müşterinizin iç belgeleri hakkında bir şey bilmezler ve bilgi sınırlarına ulaştıklarında güvenle uydururlar. RAG, modelin bir yanıt oluşturmasından önce <em>ilgili, alınan bağlamı</em> prompt'a enjekte ederek bu sorunu çözer.</p>

<p>Pipeline aşağıdaki gibidir:</p>
<ol>
    <li><strong>Ingest</strong> — Belgelerinizi parçalara ayırın ve bunları vektör gömme biçimlerine dönüştürün.</li>
    <li><strong>Store</strong> — Bu gömme biçimlerini vektör veritabanında saklayın.</li>
    <li><strong>Retrieve</strong> — Her kullanıcı sorgusunda en anlamsal benzer parçaları bulun.</li>
    <li><strong>Generate</strong> — Alınan parçaları LLM'ye bağlam olarak verin ve yanıtı akış halinde geri gönderin.</li>
</ol>

<p>Model, tahmin yapmayı bırakır ve <em>sizin</em> verileriniz üzerinden akıl yürütmeye başlar.</p>

<h2>
  <a name="setting-up-the-laravel-project" href="#setting-up-the-laravel-project"></a>
  Laravel Projesini Ayarlamak
</h2>

<p>Laravel ile OpenAI PHP istemcisini kullanacağız ve <a href="https://github.com/pgvector/pgvector" target="_blank" rel="noopener noreferrer">pgvector</a>’ı (PostgreSQL uzantısı — ücretsiz, üretim için hazır, dış hizmet gerektirmiyor) vektör deposu olarak kullanacağız.</p>

<div class="highlight js-code-highlight">
  <pre class="highlight shell"><code>composer require openai-php/laravel

php artisan vendor:publish –provider=“OpenAI\Laravel\ServiceProvider”

<p>API anahtarınızı <code>.env</code> dosyasına ekleyin:<br/></p>

<div class="highlight js-code-highlight">
  <pre class="highlight plaintext"><code>OPENAI_API_KEY=sk-...
  </code></pre>
</div>

<p>Veritabanınızdaki pgvector'ı etkinleştirin:<br/></p>

<div class="highlight js-code-highlight">
  <pre class="highlight sql"><code><span class="k">CREATE</span> <span class="n">EXTENSION</span> <span class="n">IF</span> <span class="k">NOT</span> <span class="k">EXISTS</span> <span class="n">vector</span><span class="p">;</span>
  </code></pre>
</div>

<p>Belgelerin parçalarını oluşturmak için migration'ı oluşturun:<br/></p>

<div class="highlight js-code-highlight">
  <pre class="highlight php"><code><span class="c1">// database/migrations/xxxx_create_document_chunks_table.php</span>

public function up(): void
{
Schema::create(‘document_chunks’, function (Blueprint $table) {
$table->id();
$table->foreignId(‘document_id’)->constrained()->cascadeOnDelete();
$table->text(’content’);
$table->string(’source’)->nullable();
$table->vector(’embedding’, 1536); // text-embedding-3-small boyutları
$table->timestamps();
});

<span class="no">DB</span><span class="o">::</span><span class="nf">statement</span><span class="p">(</span>
    <span class="s1>'CREATE INDEX ON document_chunks USING ivfflat (embedding vector_cosine_ops) WITH (lists = 100)'</span>
<span class="p">);</span>

}

<p>Not: <code>vector</code> sütun türü <code>pgvector</code> Laravel paketini gerektirir:<br/></p>

<div class="highlight js-code-highlight">
  <pre class="highlight shell"><code>composer require tpetry/laravel-postgresql-enhanced
  </code></pre>
</div>

<h2>
  <a name="step-1-document-ingestion-and-embedding" href="#step-1-document-ingestion-and-embedding"></a>
  Adım 1 — Belge Alımı ve Gömme
</h2>

<p>Gohkum içindeki metin, üst üste binen parçalar haline getiren ve gömme (embedding) oluşturan yeniden kullanılabilir bir hizmet:<br/></p>

<div class="highlight js-code-highlight">
  <pre class="highlight php"><code><span class="c1">// app/Services/DocumentIngestionService.php</span>

namespace App\Services;

use App\Models\DocumentChunk;
use OpenAI\Laravel\Facades\OpenAI;

class DocumentIngestionService
{
private int $chunkSize = 500; // karakter
private int $overlap = 100;

<span class="k">public</span> <span class="k">function</span> <span class="n">ingest</span><span class="p">(</span><span class="kt">int</span> <span class="nv">$documentId</span><span class="p">,</span> <span class="kt">string</span> <span class="nv">$text</span><span class="p">,</span> <span class="kt">string</span> <span class="nv">$source</span> <span class="o">=</span> <span class="s1>''</span><span class="p">):</span> <span class="kt">void</span>
<span class="p">{</span>
    <span class="nv">$chunks</span> <span class="o">=</span> <span class="nv">$this</span><span class="o">-&gt;</span><span class="nf">splitIntoChunks</span><span class="p">(</span><span class="nv">$text</span><span class="p">);</span>

    <span class="c1">// Toplu gömme — OpenAI her istekte en fazla 2048 girdiye izin verir</span>
    <span class="nv">$response</span> <span class="o">=</span> <span class="nc">OpenAI</span><span class="o">::</span><span class="nf">embeddings</span><span class="p">()</span><span class="o">-&gt;</span><span class="nf">create</span><span class="p">([</span>
        <span class="s1>'model'</span> <span class="o">=&gt;</span> <span class="s1>'text-embedding-3-small'</span><span class="p">,</span>
        <span class="s1>'input'</span> <span class="o">=&gt;</span> <span class="nv">$chunks</span><span class="p">,</span>
    <span class="p">]);</span>

    <span class="k">foreach</span> <span class="p">(</span><span class="nv">$response</span><span class="o">-&gt;</span><span class="n">embeddings</span> <span class="k">as</span> <span class="nv">$index</span> <span class="o">=&gt;</span> <span class="nv">$embedding</span><span class="p">)</span> <span class="p">{</span>
        <span class="nc">DocumentChunk</span><span class="o">::</span><span class="nf">create</span><span class="p">([</span>
            <span class="s1>'document_id'</span> <span class="o">=&gt;</span> <span class="nv">$documentId</span><span class="p">,</span>
            <span class="s1>'content'</span>     <span class="o">=&gt;</span> <span class="nv">$chunks</span><span class="p">[</span><span class="nv">$index</span><span class="p">],</span>
            <span class="s1>'source'</span>      <span class="o">=&gt;</span> <span class="nv">$source</span><span class="p">,</span>
            <span class="s1>'embedding'</span>   <span class="o">=&gt;</span> <span class="nb">json_encode</span><span class="p">(</span><span class="nv">$embedding</span><span class="o">-&gt;</span><span class="n">embedding</span><span class="p">),</span>
        <span class="p">]);</span>
    <span class="p">}</span>
<span class="p">}</span>

<span class="k">private</span> <span class="k">function</span> <span class="n">splitIntoChunks</span><span class="p">(</span><span class="kt">string</span> <span class="nv">$text</span><span class="p">):</span> <span class="kt">array</span>
<span class="p">{</span>
    <span class="nv">$chunks</span> <span class="o">=</span> <span class="p">[];</span>
    <span class="nv">$length</span> <span class="o">=</span> <span class="nb">strlen</span><span class="p">(</span><span class="nv">$text</span><span class="p">);</span>
    <span class="nv">$start</span>  <span class="o">=</span> <span class="mi">0</span><span class="p">;</span>

    <span class="k">while</span> <span class="p">(</span><span class="nv">$start</span> <span class="o"> <span class="nv">$length</span><span class="p">)</span> <span class="p">{</span>
        <span class="nv">$chunk</span>    <span class="o">=</span> <span class="nb">substr</span><span class="p">(</span><span class="nv">$text</span><span class="p">,</span><span class="nv">$start</span><span class="p">,</span><span class="nv">$this</span><span class="o">-&gt;</span><span class="n">chunkSize</span><span class="p">);</span>
        <span class="nv">$chunks</span><span class="p">[]</span> <span class="o">=</span> <span class="nb">trim</span><span class="p">(</span><span class="nv">$chunk</span><span class="p">);</span>
        <span class="nv">$start</span>   <span class="o">+=</span> <span class="p">(</span><span class="nv">$this</span><span class="o">-&gt;</span><span class="n">chunkSize</span> <span class="o">-</span> <span class="nv">$this</span><span class="o">-&gt;</span><span class="n">overlap</span><span class="p">);</span>
    <span class="p">}</span>

    <span class="k">return</span> <span class="nb">array_filter</span><span class="p">(</span><span class="nv">$chunks</span><span class="p">);</span>
<span class="p">}</span>

}

<p><strong>Neden üst üste binen parçalar?</strong> Belirli noktalarda böldüğünüzde cümleler düşünce yarıda kalır. 100 karakterlik bir örtüşme, kavramların parça sınırlarını geçmesini sağlar.</p>

<h2>
  <a name="step-2-semantic-retrieval" href="#step-2-semantic-retrieval"></a>
  Adım 2 — Anlamsal Alma
</h2>

<p>Bir kullanıcı sorgusu gönderdiğinde, onu gömerek en yakın parçaları buluruz:<br/></p>

<div class="highlight js-code-highlight">
  <pre class="highlight php"><code><span class="c1">// app/Services/RetrievalService.php</span>

namespace App\Services;

use App\Models\DocumentChunk;
use Illuminate\Support\Collection;
use OpenAI\Laravel\Facades\OpenAI;

class RetrievalService
{
public function retrieve(string $query, int $topK = 5): Collection
{
$response = OpenAI::embeddings()->create([
’model’ => ’text-embedding-3-small’,
’input’ => $query,
]);

    <span class="nv">$queryVector</span> <span class="o">=</span> <span class="nb">json_encode</span><span class="p">(</span><span class="nv">$response</span><span class="o">-&gt;</span><span class="n">embeddings</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">-&gt;</span><span class="n">embedding</span><span class="p">);</span>

    <span class="c1">// pgvector kosinüs mesafe operatörü: </span>
    <span class="k">return</span> <span class="nc">DocumentChunk</span><span class="o">::</span><span class="nf">selectRaw</span><span class="p">(</span>
            <span class="s1>'id, content, source, 1 - (embedding  ?) AS similarity'</span><span class="p">,</span>
            <span class="p">[</span><span class="nv">$queryVector</span><span class="p">]</span>
        <span class="p">)</span>
        <span class="o">-&gt;</span><span class="nf">orderByDesc</span><span class="p">(</span><span class="s1>'similarity'</span><span class="p">)</span>
        <span class="o">-&gt;</span><span class="nf">limit</span><span class="p">(</span><span class="nv">$topK</span><span class="p">)</span>
        <span class="o">-&gt;</span><span class="nf">get</span><span class="p">();</span>
<span class="p">}</span>

}

<p><code/> operatörü pgvector ile Postgres'te kosinüs mesafesini yerel olarak hesaplar — çoğu üretim yüklerinde dış bir vektör DB aboneliğine ihtiyaç duymazsınız.</p>

<h2>
  <a name="step-3-the-rag-chat-controller" href="#step-3-the-rag-chat-controller"></a>
  Adım 3 — RAG Chat Kontrolörü
</h2>

<p>Şimdi alma işlemini oluşturma adımıyla birleştiriyoruz:<br/></p>

<div class="highlight js-code-highlight">
  <pre class="highlight php"><code><span class="c1">// app/Http/Controllers/ChatController.php</span>

public function ask(Request $request, RetrievalService $retrieval): StreamedResponse
{
$query = $request->validate([’message’ => ’required|string|max:1000′])[’message’];
$chunks = $retrieval->retrieve($query);

<span class="nv">$context</span> <span class="o">=</span> <span class="nv">$chunks</span><span class="o">-&gt;</span><span class="nf">pluck</span><span class="p">(</span><span class="s1>'content'</span><span class="p">)</span><span class="o">-&gt;</span><span class="nb">implode</span><span class="p">(</span><span class="s2>\"\n\n---</span><span class="se>\"\n\n</span>);</span>

<span class="nv">$systemPrompt</span> <span class="o">=</span> <span class="sh">

<span class="k">return</span> <span class="nf">response</span><span class="p">()</span><span class="o">-&gt;</span><span class="nf">stream</span><span class="p">(</span><span class="k">function</span> <span class="p">()</span> <span class="k">use</span> <span class="p">(</span><span class="nv">$systemPrompt</span><span class="p">,</span><span class="nv">$query</span><span class="p">)</span> <span class="p">{</span>
    <span class="nv">$stream</span> <span class="o">=</span> <span class="nc">OpenAI</span><span class="o">::</span><span class="nf">chat</span><span class="p">()</span><span class="o">-&gt;</span><span class="nf">createStreamed</span><span class="p">([</span>
        <span class="s1>'model'</span>    <span class="o">=&gt;</span> <span class="s1>'gpt-4o-mini'</span><span class="p">,</span>
        <span class="s1>'messages'</span> <span class="o">=&gt;</span> <span class="p">[</span>
            <span class="p>[</span><span class="s1>'role'</span> <span class="o">=&gt;</span> <span class="s1>'system'</span><span class="p">,</span>  <span class="s1>'content'</span> <span class="o">=&gt;</span> <span class="nv">$systemPrompt</span><span class="p">],</span>
            <span class="p>[</span><span class="s1>'role'</span> <span class="o">=&gt;</span> <span class="s1>'user'</span><span class="p">,</span>    <span class="s1>'content'</span> <span class="o">=&gt;</span> <span class="nv">$query</span><span class="p">],</span>
        <span class="p">],</span>
    <span class="p">]);</span>

    <span class="k">foreach</span> <span class="p">(</span><span class="nv">$stream</span> <span class="k">as</span> <span class="nv">$response</span><span class="p">)</span> <span class="p">{</span>
        <span class="nv">$text</span> <span class="o">=</span> <span class="nv">$response</span><span class="o">-&gt;</span><span class="n">choices</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">-&gt;</span><span class="n">delta</span><span class="o">-&gt;</span><span class="n">content</span> <span class="o">??</span> <span class="s1>''</span><span class="p">;</span>
        <span class="k">echo</span> <span class="s2>\"data: \"</span> <span class="mf">.</span> <span class="nb">json_encode</span><span class="p">([</span><span class="s1>'text'</span> <span class="o">=&gt;</span> <span class="nv">$text</span><span class="p">])</span> <span class="mf">.</span> <span class="s2>\"</span><span class="se>\n\n</span><span class="s2>\"</span><span class="p">;</span>
        <span class="nb">ob_flush</span><span class="p">();</span>
        <span class="nb">flush</span><span class="p">();</span>
    <span class="p">}</span>

    <span class="k">echo</span> <span class="s2>\"data: [DONE]\"</span><span class="se>\n\n</span><span class="s2>\"</span><span class="p">;</span>
<span class="p">},</span> <span class="mi">200</span><span class="p">,</span> <span class="p">[</span>
    <span class="s1>'Content-Type'</span>  <span class="o">=&gt;</span> <span class="s1>'text/event-stream'</span><span class="p">,</span>
    <span class="s1>'Cache-Control'</span> <span class="o">=&gt;</span> <span class="s1>'no-cache'</span><span class="p">,</span>
    <span class="s1>'X-Accel-Buffering'</span> <span class="o">=&gt;</span> <span class="s1>'no'</span><span class="p">,</span>
<span class="p">]);</span>

}

<p>Akış yanıtı, WebSocket'ler olmadan gerçek zamanlı yazım efekti için avantaja sahip Server-Sent Events (SSE) kullanır.</p>

<h2>
  <a name="step-4-connecting-the-frontend-with-alpinejs" href="#step-4-connecting-the-frontend-with-alpinejs"></a>
  Adım 4 — Ön Ucu Alpine.js ile Bağlama
</h2>

<div class="highlight js-code-highlight">
  <pre class="highlight html"><code><span class="nt/>
<span class="nt"><script/></span>
<span class="kd">function</span> <span class="nf">chatBot</span><span class="p">()</span> <span class="p">{</span>
    <span class="k">return</span> <span class="p">{</span>
        <span class="na">message</span><span class="p">:</span> <span class="dl>''</span><span class="p">,</span>
        <span class="na">response</span><span class="p">:</span> <span class="dl>''</span><span class="p">,</span>
        <span class="k">async</span> <span class="nf">send</span><span class="p">()</span> <span class="p">{</span>
            <span class="k">this</span><span class="p">.</span><span class="nx">response</span> <span class="o">=</span> <span class="dl>''</span><span class="p">;</span>
            <span class="kd">const</span> <span class="nx">es</span> <span class="o">=</span> <span class="k">new</span> <span class="nc">EventSource</span><span class="p">(</span><span class="s2>`/chat?message=</span><span class="p>${</span><span class="nf">encodeURIComponent</span><span class="p">(</span><span class="k">this</span><span class="p">.</span><span class="nx">message</span><span class="p">)}</span><span class="s2>`</span><span class="p">);</span>
            <span class="nx">es</span><span class="p">.</span><span class="nx">onmessage</span> <span class="o">=</span> <span class="p">(</span><span class="nx">e</span><span class="p">)</span> <span class="o">=&gt;</span> <span class="p">{</span>
                <span class="k">if</span> <span class="p">(</span><span class="nx">e</span><span class="p">.</span><span class="nx">data</span> <span class="o">===</span> <span class="dl>'</span><span class="s1>[DONE]</span><span class="dl>'</span><span class="p">)</span> <span class="p">{</span> <span class="nx">es</span><span class="p">.</span><span class="nf">close</span><span class="p">();</span> <span class="k">return</span><span class="p">;</span> <span class="p">}</span>
                <span class="k">this</span><span class="p">.</span><span class="nx">response</span> <span class="o">+=</span> <span class="nx">JSON</span><span class="p">.</span><span class="nf">parse</span><span class="p">(</span><span class="nx">e</span><span class="p">.</span><span class="nx">data</span><span class="p">).</span><span class="nx">text</span><span class="p">;</span>
            <span class="p">};</span>
            <span class="k">this</span><span class="p">.</span><span class="nx">message</span> <span class="o">=</span> <span class="dl>''</span><span class="p">;</span>
        <span class="p">}</span>
    <span class="p">}</span>
<span class="p">}</span>
<span class="nt/>
  </code></pre>
</div>

<h2>
  <a name="tuning-tips-for-production" href="#tuning-tips-for-production"></a>
  Üretim İçin Ayarlama İpuçları
</h2>

<p><strong>Parça stratejisi, modelden daha önemlidir.</strong> Yanlış parçalanmış belgeler, LLM'nın gücünden bağımsız olarak ilgisiz alma sonuçları üretir. SSS'ler gibi yapılandırılmış içerikler için, karakter sayısına göre değil, soru-cevap çiftine göre parçalayın.</p>

<p><strong>Metadata filtreleme ekleyin.</strong> Eğer sisteminiz birden fazla müşteri veya belge kategorisi sunuyorsa, bir <code>tenant_id</code> veya <code>category</code> sütunu ekleyin ve vektör aramasından önce filtreleyin. Bu, hassasiyeti önemli ölçüde arttırır ve bağlamın çapraz kontaminasyonunu önler.</p>

<p><strong>Alınan parçaları yeniden sıralayın.</strong> Yüksek riskli uygulamalar için, alınan en iyi 10 parçayı bir çapraz kodlayıcı yeniden sıralayıcıdan geçirerek (Cohere Rerank veya yerel bir model) sadece en iyi 3'ünü LLM'ye gönderin. Bu, hayal gücünü daha da azaltır.</p>

<p>Bu tam mimari — pgvector, Laravel ve akış SSE — farklı sektörlerdeki müşteri bilgi tabanları için <a href="https://hanzweb.ae" target="_blank" rel="noopener noreferrer">HanzWeb.ae</a>'nde devreye alındı ve pgvector, özel bir vektör DB'sine (Pinecone gibi) başvurmadan yüz binlerce vektörü tutarlı bir şekilde işleyebiliyor.</p>

<h2>
  <a name="conclusion" href="#conclusion"></a>
  Sonuç
</h2>

<p>RAG sihir değildir — bir mühendislik kalıbıdır. Pipeline'ınızın kalitesi üç şeye bağlıdır: belgeleri nasıl böldüğünüz, bağlamı ne kadar doğru aldığınız ve modeli o bağlamda kalması için nasıl net şekilde talimatlandırdığınız. Bu üç şeyi doğru yaparsanız, kullanıcı güvenini gerçekten kazanan bir AI özelliği inşa etmiş olursunuz.</p>

<p>Küçük bir belge seti ile başlayın, alma benzerlik puanlarınızı enstrümante edin ve ölçeklemeden önce parçalama stratejinizi yineleyin. Model neredeyse asla darboğaz değildir — veri hazırlamanızdır.</p>

Kaynak: Orijinal Makale

Sıfırdan RAG’a: Laravel Uygulamasında Retrieval-Augmented Generation’ı Uygulama

Sanal Medya

Son Eklenenler

2026’da hala Blade kullanan var mı? Kullanmalı mı — ve gizli bir nedeni var

Bethesda’nın Starfield’ı 2027’de Yeni İçeriklerle Yükseliyor

Robovac Açığı: Diğer Shark’lere Root Erişimi Sağlıyor

Kendi Fiziksel Oyun Kartuşlarını Üreten PC Oyun Yazarından Yenilikçi Proje

CDC’nin Cyclospora Laboratuvarı: Personel Azalması Tehlike Arttırıyor!

ASML, Low-NA EUV araçlarının fiyatlarını artırmayı hedefliyor

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer