EngineeringJune 17, 20266 min read

Gerçek Yazılım Üreten ve Yayına Alan AI Agent'lar: Jobbit'in Mimarisi

Gerçek yazılım üreten AI agent'lar geliştirmeye dair mühendislik incelemesi — çok agent'lı orkestrasyon, araç kullanımı, sandbox kod yürütme, RAG, eval ve edge dağıtımı; Jobbit ve Jobbit Labs ekibinden.

Read in:

Çoğu "AI agent" konuşmanın ötesine geçmez. Cevap verirler, sonra işi bir insan yapar. Asıl ilgi çekici — ve gerçekten zor — mühendislik problemi, işi bizzat yapan agent'lar geliştirmektir: tam yığın (full-stack) bir uygulama yazan, onu çalıştıran, kendi hatalarını düzelten ve üretime dağıtan agent'lar. Jobbit ve Ar-Ge bölümü Jobbit Labs'in (jobbitlabs.com) mühendislik ekibi her gün tam da bu problem üzerinde çalışıyor.

Bu yazı, yazılım üreten ve yayına alan AI agent'ların ardındaki kalıpları ele alan bir mühendislik incelemesi — mimari, hata modları ve çıkarılan dersler. Bilinçli olarak pratik ve sağlayıcıdan bağımsız tutuldu: ister LLM'ler, ister çok agent'lı orkestrasyon, ister araç çağırma (tool calling) ya da RAG üzerine inşa ediyor olun, bu ilkeler her yere taşınır.

Chatbot'lar cevap verir; agent'lar harekete geçer

Bir chatbot'tan bir agent'a sıçramak, metin üretmekten dünyada eylemde bulunmaya sıçramaktır. Bir agent çok adımlı bir görevi planlamak, araçları çağırmak, sonuçları okumak ve bir sonraki adıma karar vermek zorundadır — sonra hedefe ulaşana dek bunu tekrarlamalıdır. Çoğunlukla agentic döngü (ya da akıl yürüt–eyleme geç döngüsü) olarak adlandırılan bu döngü, sistemin kalbidir.

Mühendislik açısından zorluk, her adımın başarısız olabilmesidir. Model var olmayan bir fonksiyonu uydurabilir, derlenmeyen kod yazabilir, bir aracın çıktısını yanlış okuyabilir ya da sessizce görevden sapabilir. Yanılan bir chatbot kötü bir cümle üretir; yanılan bir agent bozuk bir dağıtım üretir. Asıl mühendislik işi, ham yetenek değil, güvenilirliktir.

Mimari: planlayıcı, yürütücü, araçlar

Sağlam bir agent platformu planlamayı yürütmeden ayırır. Bir planlama katmanı, bir hedefi ("ödemeli bir rezervasyon uygulaması geliştir") somut adımlara böler; bir yürütme katmanı her adımı araçlar kullanarak gerçekleştirir. Bu sorumlulukları ayrı tutmak sistemi hata ayıklanabilir kılar: planı, her adımın nasıl çalıştığından bağımsız olarak inceleyebilirsiniz.

Araç kullanımı (tool use), bir agent'ın elleri olduğu yerdir. Araçlar, modelin çağırabileceği iyi tanımlanmış fonksiyonlardır — bir dosya oku, kod yaz, bir derleme çalıştır, bir veritabanı sorgula, dağıt. Buradaki mühendislik disiplini arayüz tasarımıdır: her aracın sıkı, belirsizlik içermeyen bir şemaya, doğrulanmış girdilere ve modelin güvenilir biçimde ayrıştırabileceği yapılandırılmış çıktılara ihtiyacı vardır. Gevşek araç arayüzleri, agent hatalarının başlıca kaynağıdır; sıkı arayüzler ise elde edebileceğiniz en ucuz güvenilirlik kazancıdır.

Karmaşık işlerde tek bir agent çoğu zaman yerini çok agent'lı orkestrasyona bırakır — planlayan, kod yazan, gözden geçiren ve doğrulayan, bir orkestratör tarafından koordine edilen uzmanlaşmış agent'lar. Bu ayrıştırma size odak (her agent'ın dar bir işi ve dar bir bağlamı olur) ve paralellik (bağımsız alt görevler eşzamanlı çalışır) kazandırır. Bunun bedeli koordinasyon yüküdür; bu yüzden orkestrasyon katmanı mümkün olan yerde deterministik, mümkün olmayan yerde dayanıklı olmalıdır.

Gerçek kodu güvenli biçimde çalıştırmak ve dağıtmak

Yazılım yazan bir agent, o yazılımı çalıştırmak zorundadır — ve model tarafından üretilen kodu çalıştırmak, her şeyden önce bir güvenlik problemidir. Çözüm sandbox (izole) kod yürütmedir: güvenilmeyen kod, kısıtlı kaynaklarla, gizli bilgilere erişimi olmadan ve sıkı ağ sınırları içinde izole bir ortamda çalışır. Sandbox, bir agent'ın yineleme yapmasını — derle, test et, hatayı oku, düzelt — platformu ya da diğer kullanıcıları riske atmadan mümkün kılan şeydir.

Dağıtım, üretilen bir uygulamayı bir ürüne dönüştüren adımdır. Gerçek bir AI uygulama geliştirici (AI app builder), koddan canlı bir URL'ye giden yolun tamamına sahip çıkar: derle, barındırma sağla, bir alan adı bağla, TLS'i sonlandır. Bunu iyi mühendislemek, dağıtımları tekrarlanabilir ve geri alınabilir kılmak demektir — aynı girdiler aynı sonucu üretir ve kötü bir dağıtım geri alınabilir. İdempotentlik ve temiz geri alma göz alıcı değildir, ama otonom dağıtımı güvenilir kılan şeyler tam da bunlardır.

Bağlam, bellek ve geri getirme

LLM'lerin bağlamı sonludur ve gerçek projeler buna sığmaz. Bu yüzden ciddi bir agent sistemi bağlam mühendisliğine (context engineering) ağırlık verir: modelin her adımda neyi göreceğine karar vermek. Her şeyi prompt'a tıkıştırmak hem pahalı hem de ters etki yaratır — fazla alakasız bağlam akıl yürütmeyi bozar.

İşte RAG'ın (geri getirmeyle zenginleştirilmiş üretim — retrieval-augmented generation) ve vektör veritabanlarının yerini kazandığı nokta burasıdır. Tüm bir kod tabanını bağlama boşaltmak yerine sistem, mevcut adımla ilgili birkaç dosyayı, sembolü ya da belgeyi geri getirir. Yapılandırılmış bellekle — kararların, evrilen şartnamenin ve şimdiye dek neyin denendiğinin kaydı — birleştiğinde geri getirme, agent'ı uzun bir görev boyunca bağlam penceresini patlatmadan zemine sabit tutar. İyi bir geri getirme, çoğu zaman daha büyük bir modelden daha güçlü bir kalite kaldıracıdır.

Güvenilirlik: eval'ler, doğrulama ve koruma bariyerleri

Üretim seviyesindeki agent mühendisliğini demolardan ayıran tek bir fikir varsa o da şudur: ölçemediğinizi yayına alamazsınız. Agentic sistemler olasılıksaldır (stokastik), dolayısıyla güvenilirlik eval'ler aracılığıyla mühendislenir — agent'ı temsili görevler üzerinde puanlayan ve gerilemeleri kullanıcılar fark etmeden yakalayan otomatik test paketleri. "Daha iyi hissettiren" ama eval puanlarınızı dibe vuran bir değişiklik, yayına almadığınız bir değişikliktir.

Eval'lerin üzerine, çalışma zamanı koruma bariyerleri (guardrails) ve doğrulama oturur. En etkili kalıp çekişmeli (adversarial) öz-denetimdir: bir agent bir sonuç ürettikten sonra — bir kod parçası, bir plan, bir düzeltme — ayrı bir doğrulama geçişi onu çürütmeye çalışır. Kod derleniyor mu? Testler geçiyor mu? Çıktı şemayla eşleşiyor mu? Doğrulamayı ayrı, şüpheci bir adım olarak ele almak, tek ve özgüvenli bir geçişin kaçıracağı hataların büyük bir kısmını yakalar. Geri çekilmeli (backoff) yeniden denemeler, devre kesiciler (circuit breaker) ve insana yükseltme gerisini halleder.

Hata ayıklayabileceğiniz gözlemlenebilirlik

Otonom bir sistem görev başına onlarca karar verdiğinde, bunları görmeniz gerekir. Gözlemlenebilirlik (observability) — her prompt'un, araç çağrısının ve sonucun yapılandırılmış izlenmesi — pazarlık konusu değildir. Bir agent yanlış yaptığında, sapan adımı tam olarak bulmanın, onu yeniden üretmenin ve kök nedeni düzeltmenin yolu bu izdir. Agent izlerini birinci sınıf telemetri olarak ele alan mühendislik ekipleri dakikalar içinde hata ayıklar; etmeyenler günlerce uğraşır.

Edge ve esnek ölçeklenme

Agent iş yükleri ani yükselişlidir ve gecikmeye duyarlıdır; bu da edge computing'i doğal bir tercih yapar. Kullanıcılara yakın çalışmak — Cloudflare Workers ve edge veri depoları gibi platformlarda — gidiş-dönüş gecikmesini azaltır ve talebe göre esnek biçimde ölçeklenir. Jobbit Labs, veri ve ürün altyapısının bazı bölümleri için bu edge-öncelikli yaklaşıma yaslanır: küresel olarak dağıtık, otomatik ölçeklenen ve kullandığın-kadar-öde; böylece kapasite atıl beklemek yerine yükü takip eder.

İnsan-döngüde (human-in-the-loop) katmanı

Mimarinin son parçası, çoğu agent platformunun eksik bıraktığı parçadır: bir insan-döngüde (human-in-the-loop) yolu. AI hacmi ve hızı üstlenir, ama bazı kararlar — güvenlik açısından hassas mantık, hukuki ifadeler, tasarım yargısı — bir insana aittir. Bunu mühendislemek, denetimden geçmiş bir insan uzmanın devreye girebileceği temiz devir noktaları kurmak ve işlemi emanet (escrow) ile korumak demektir. Agent ve insan ağı rakip katmanlar değildir; tüm sistemi güvenle dayanılabilir kılan, tasarıma gömülü bir geri çekilme mekanizmasıdır.

Agent geliştiren mühendisler için dersler

Agentic sistemler geliştiriyorsanız, birkaç ilke yatırımının karşılığını kat kat verir.

Sıkı araç arayüzleri tasarlayın. Çoğu agent hatası belirsiz araçlara dayanır. Katı şemalar ve doğrulanmış girdi/çıktı, satın alabileceğiniz en ucuz güvenilirliktir.

Çekişmeli doğrulayın. Özgüvenli ilk geçişe güvenmeyin. İşi sonucu çürütmek olan ayrı bir adım ekleyin.

Eval'lerle ölçün. Agent'ı ölçeklendirmeden önce eval altyapısını kurun. Puanlayamadığınız şeyi iyileştiremezsiniz.

Bağlamı mühendisleyin, boşaltmayın. İlgili olanı geri getirin; önemli olanı hatırlayın. Daha büyük prompt'lar daha iyi prompt'lar değildir.

Güvenilmeyen her şeyi sandbox'layın. Bir agent kod çalıştırıyorsa, izolasyon bir özellik değil, bir ön koşuldur.

Bir insan yolu bırakın. En güvenli otonom sistem, ne zaman bir insana danışacağını bilen sistemdir.

Sıkça sorulan sorular

Bir AI agent'ı bir chatbot'tan ayıran nedir?

Bir chatbot metin üretir; bir AI agent planlar ve eylemde bulunur — araçları çağırır, kod çalıştırır ve bir hedefe doğru yineler. Mühendislik açısından zorluk, herhangi bir tek hatanın sonucu bozabildiği çok sayıda adım boyunca güvenilirliği sağlamaktır.

AI tarafından üretilen kod güvenli biçimde nasıl çalıştırılır?

Sandbox kod yürütmeyle: güvenilmeyen kod, sınırlı kaynaklarla, gizli bilgilere erişimi olmadan ve kısıtlı ağ ile izole bir ortamda çalışır; böylece agent, platformu riske atmadan derleyebilir, test edebilir ve düzeltebilir.

Eval'ler agent sistemleri için neden bu kadar önemli?

Agent'lar olasılıksal olduğundan, temsili görevlerdeki kaliteyi ölçmek ve gerilemeleri yayına almadan yakalamak için otomatik eval'lere ihtiyacınız vardır. Onlar olmadan "iyileştirmeler" yalnızca tahminden ibarettir.

Jobbit Labs ne yapar?

Jobbit Labs (jobbitlabs.com), Jobbit'in arkasındaki Ar-Ge ve veri bölümüdür; daha ağır, veri yoğun ve kurumsal mühendisliğe odaklanır — araştırma, veri platformları ve ürünün üzerine inşa edildiği agent temelleri.

Yazılım üreten ve yayına alan agent'ların ardındaki mühendisliği merak mı ediyorsunuz? jobbit.uk ve jobbitlabs.com adreslerini keşfedin.