Çoklu Ajan Yapay Zeka Sistemleri Geliştirmek: UTRAX’tan Dersler

UTRAX — beyaz etiketli bir telematik platformu — için yapay zeka katmanını oluşturmaya başladığımızda, ilk içgüdümüz her şeyi halledebilecek tek bir akıllı sohbet botu yapmaktı. Bu içgüdü yanlıştı.

Altı aylık geliştirme, test etme ve üretim ortamında iyileştirme sürecinin ardından, her biri farklı bir alanda uzmanlaşmış altı yapay zeka ajanından oluşan bir sistem ortaya çıkardık. İşte öğrendiklerimiz ve çoklu ajan mimarisinin neden doğru karar olduğu.

Neden Tek Bir Ajan Yetmez?

Tek ajan yaklaşımı kulağa daha basit gelir: tüm araçlarınıza ve verilerinize erişimi olan tek bir büyük dil modeli. Pratikte bu yaklaşım hızla çöker:

Bağlam penceresi aşırı yüklenmesi. Bir telematik platformunda araç takibi, raporlama, teşhis, kullanıcı yönetimi, alarm ve destek iş akışları bulunur. Tüm bunlara ait talimatları, araç tanımlarını ve bağlamı tek bir sistem mesajına sıkıştırmak, her konuda vasat bir model yaratır.

Çelişen talimatlar. Bir destek teşhis ajanından istediğiniz davranış (sistematik, temkinli, prosedür takipçisi) ile bir analiz ajanından istediğiniz davranış (keşifçi, yaratıcı, örüntü arayan) temelden farklıdır. Tek bir sistem mesajı her iki kişiliğe de iyi hizmet edemez.

Öngörülemeyen yönlendirme. Tek bir ajan her şeyi ele aldığında, kullanıcılar modelin bir isteğin rapor sorgusu mu, izleme komutu mu yoksa destek talebi mi olduğuna karar veremediği uç durumlarla karşılaşır. Bu belirsiz durumlar en kötü kullanıcı deneyimlerini yaratır.

Test ve iyileştirme sürtünmesi. Bir yeteneği geliştirdiğinizde, diğerini geriletme riski taşırsınız. Monolitik bir ajan, bir işlevi diğerlerini etkilemeden iyileştirmeyi neredeyse imkansız kılar.

UTRAX Mimarisi: Altı Uzman

UTRAX’ı, her birinin odaklanmış bir alanı, özel araçları ve özelleştirilmiş sistem mesajları olan altı ajanla kurduk:

1. İzleme Ajanı

Alan: Gerçek zamanlı filo takibi ve harita kontrolü. Ne yapar: Doğal dil sorgularını araç filtrelerine ve harita komutlarına çevirir. Bir filo yöneticisi “Ankara’da 2 saattir hareket etmeyen tüm kamyonları göster” diyebilir ve ajan bunu uygun API çağrılarına dönüştürür. Temel tasarım kararı: Bu ajan araç verilerine yalnızca okuma erişimine sahiptir. Filtreleyebilir ve görüntüleyebilir ama asla araç durumunu değiştiremez. Katı araç sınırları istenmeyen yan etkileri önler.

2. Genel Yardım Ajanı

Alan: Platform yardımı ve kullanıcı rehberliği. Ne yapar: Kullanıcı kılavuzu, SSS ve özellik dokümantasyonu üzerinde RAG kullanarak platform hakkındaki soruları yanıtlar. Yeni kullanıcılar için etkileşimli yönlendirmeler sağlar. Temel tasarım kararı: Bu ajan, açık sürümlemeye sahip özenle hazırlanmış bir bilgi tabanı kullanır. Platform güncellendiğinde, bilgi tabanı da güncellenir. Eski yanıt sorunu olmaz.

3. Raporlama Ajanı

Alan: Rapor oluşturma ve zamanlama. Ne yapar: Kullanıcılar hangi veriyi istediklerini doğal dille tanımlar. Ajan rapor parametrelerini yapılandırır, raporları oluşturur ve zamanlanmış teslimler ayarlar. Temel tasarım kararı: Ajan, tam rapor oluşturmadan önce bir önizleme gösterir. Bu “çalıştırmadan önce onayla” modeli gereksiz hesaplamayı önler ve kullanıcılara isteklerini iyileştirme fırsatı verir.

4. Sağlık Kontrol Ajanı

Alan: Cihaz veri kalitesi ve teşhis. Ne yapar: Takip cihazlarından gelen veri kalitesini gerçek zamanlı izler. Kayıp GPS konumları, pil tükenme kalıpları veya iletişim kopuklukları gibi anomalileri tespit eder. Sorunlar müşteriye yansımadan önce operatörleri uyarır. Temel tasarım kararı: Bu ajan hem reaktif (sorgulara yanıt veren) hem de proaktif (akışları izleyen) olarak çalışır. Proaktif mod, alarm yorgunluğunu önlemek için dikkatli hız sınırlaması gerektirdi.

5. Analiz Ajanı

Alan: İleri seviye analitik ve alarm sorguları. Ne yapar: Karmaşık analitik soruları ele alır — sürücü davranış puanlaması, rota optimizasyonu içgörüleri, yakıt verimliliği trendleri ve alarm kalıp analizi. Temel tasarım kararı: Bu ajan ham akışlara değil, toplulaştırılmış tarihsel verilere erişime sahiptir. Bu, analitik iş yükleri için sorgu maliyetlerini yönetilebilir ve yanıt sürelerini makul tutar.

6. Destek Ajanı

Alan: Veri akışı sorun giderme ve destek kaydı oluşturma. Ne yapar: Bir cihaz doğru veri raporlamıyorsa, bu ajan bir teşhis akışından geçer — bağlantıyı, veri format sorunlarını, sunucu tarafı işlemeyi kontrol eder — ve tüm ilgili teşhis bilgileriyle yapılandırılmış destek kayıtları oluşturur. Temel tasarım kararı: Destek ajanı kayıt oluşturur ama bunları bağımsız olarak çözemez. Tam teşhis bağlamıyla insanlara yönlendirir ve destek ekibini çok daha verimli hale getirir.

Önemli Mimari Kararlar

Ajan Yönlendirici

Gelen mesajları sınıflandıran ve uygun ajana yönlendiren hafif bir yönlendirici oluşturduk. Yönlendirici, niyet sınıflandırması ve açık kullanıcı bağlamının (hangi sayfadalar, en son ne yaptılar) birleşimini kullanarak yönlendirme kararları verir.

Kritik içgörü: yönlendirici hızlı ve temkinli olmalıdır. Yönlendirme konusunda güvenli değilse, tahmin etmek yerine kullanıcıdan netleştirmesini ister. Bir saniyelik bir netleştirme sorusu, on saniyelik yanlış ajan yanıtından çok daha iyidir.

Paylaşılan Bağlam, İzole Çalıştırma

Tüm ajanlar ortak bir kullanıcı bağlamını (kullanıcının kim olduğu, yetkileri, filo konfigürasyonu) paylaşır ancak izole araç erişimi ve sistem mesajlarına sahiptir. Bu, bir ajanın diğerinin ne yaptığına atıfta bulunabilmesi (“Az önce bir yakıt raporu oluşturdunuz — eşiğinizi aşan araçlar için alarm kurmak ister misiniz?”) ancak diğer ajanın araçlarına erişiminin olmaması anlamına gelir.

Yapılandırılmış Araç Çıktıları

Her araç, serbest metin değil yapılandırılmış veri döndürür. Ajanlar yanıtı kullanıcı için biçimlendirir, ancak altta yatan veri her zaman makine tarafından okunabilirdir. Bu, testi deterministik kılar — modelin yanıtını nasıl ifade ettiğinden bağımsız olarak yapılandırılmış çıktı üzerinde doğrulama yapabilirsiniz.

Değerlendirme Boru Hattı

Her ajanı yüzlerce test vakasıyla bağımsız olarak test eden otomatik bir değerlendirme boru hattı kurduk. Her test vakasının beklenen bir araç çağrısı dizisi ve beklenen çıktı yapısı vardır. Bu, geriletmeleri üretime ulaşmadan önce yakalar.

Öğrenilen Dersler

Altı değil, iki ajanla başlayın. Altı ajanın hepsini aynı anda oluşturmadık. İzleme ve Genel Yardım ile başladık, mimariyi doğruladık, ardından ajanları kademeli olarak ekledik. Her yeni ajan, kalıplar oturduğu için daha az zaman aldı.

Ajan sınırları yetki sınırlarını takip etmeli. Ajan kapsamını tanımlamanın en temiz yolu, hangi araçlara ve verilere erişebildiğidir. İki yetenek farklı yetki seviyeleri gerektiriyorsa, muhtemelen farklı ajanlara ait olmalıdır.

Kullanıcıların ajanları bilmesi gerekmez. Yönlendirme kullanıcılar için görünmezdir. Bir mesaj yazarlar ve yanıt alırlar. Çoklu ajan mimarisi bir uygulama detayıdır, reklamı yapılacak bir özellik değil.

İzleme pazarlık konusu değildir. Her ajanın yanıt süreleri, hata oranları, araç çağrı kalıpları ve kullanıcı memnuniyeti sinyallerini takip eden kendi panosu vardır. Bir şeyler ters gittiğinde, hangi ajanın zorlandığını ve nedenini bilmeniz gerekir.

İnsanlara zarif geçiş yapın. Her ajanın net bir yükseltme yolu vardır. Güven düşük olduğunda veya görev kapsam dışında olduğunda, ajan tam bağlamla bir insana devreder. En kötü kullanıcı deneyimi, yanlış yanıtı güvenle veren bir yapay zekadır.

Çoklu Ajan Mimarisi Ne Zaman Kullanılmalı?

Çoklu ajan sistemleri karmaşıklık ekler. Her zaman doğru tercih değildir. Şu durumlarda kullanın:

Alanınızda farklı veri erişim kalıplarına sahip doğal olarak ayrık fonksiyonel bölgeler varsa
Farklı fonksiyonlar temelden farklı ajan davranışları gerektiriyorsa
Geriletme riski olmadan bireysel yetenekler üzerinde iyileştirme yapmanız gerekiyorsa
Yetki sınırları önemliyse ve fonksiyonlar arasında farklılık gösteriyorsa
Sistem tek bir bağlam penceresinin kaldırabileceğinin ötesinde ölçeklenmeli ise

Daha basit kullanım alanları için — tek amaçlı bir sohbet botu, bir belge soru-cevap sistemi, temel bir iş akışı otomasyonu — iyi tasarlanmış tek bir ajan daha iyi bir seçimdir. İhtiyacınız olmayan mimari karmaşıklık eklemeyin.

Kendi Çoklu Ajan Sisteminizi Oluşturma

Platformunuz çoklu ajan mimarisinden faydalanacaksa, doğru sınırlarla başlamak önemlidir. Alanınızı fonksiyonel bölgelere haritalayın, her biri için araç erişimini ve yetkileri tanımlayın ve mimariyi kanıtlayan en basit iki ajanlı sistemi oluşturun.

Owlica AI olarak yaptığımız budur. UTRAX deneme alanımızdı ve orada geliştirdiğimiz kalıplar sektörler genelinde — lojistikten finansa, üretimden kurumsal hizmetlere — geçerlidir.

Çoklu ajan yaklaşımının platformunuza uygun olup olmadığını keşfetmek ister misiniz? İletişime geçin.