Çin merkezli teknoloji şirketi Tencent tarafından yayımlanan yeni teknik çalışma, yapay zeka bağlam öğrenme sorunu etrafında önemli bir tartışma başlattı. Çalışma, mevcut en ileri dil modellerinin dahi, düzensiz ve öngörülemeyen gerçek dünya senaryolarında bağlamdan soyutlama ve genelleme yapmakta ciddi kısıtlar yaşadığını ortaya koyuyor.
İnsan Öğrenmesi ile Yapay Zeka Arasındaki Temel Uçurum Ortaya Çıktı
Tencent araştırmacıları, yapay zeka bağlam öğrenme sorunu başlığını merkeze alarak insanlar ile yapay zeka sistemlerinin öğrenme biçimlerini karşılaştırdı. Araştırmacılar, insanların yeni bir durumla karşılaştığında geçmişte ezberlenen bilgilere değil, o anki bağlama dayanarak çözüm ürettiğini belirtiyor. Bir yazılımcının yeni bir yazılım aracını inceleyerek kısa sürede kullanmaya başlaması ya da bir oyuncunun kural kitabını okuyarak oyunu deneyim yoluyla öğrenmesi bu farkı açık biçimde gösteriyor.

Mevcut büyük dil modelleri, ağırlıklı olarak ön eğitim sırasında parametrelerine yerleştirilen bilgileri geri çağırıyor. Bu yapı, yapay zeka öğrenme sınırlamaları olarak tanımlanan temel sorunu oluşturuyor. Çıkarım aşamasında sistemler, yeni bilgiyi aktif biçimde içselleştirmek yerine statik belleğe yaslanan yanıtlar üretiyor.
Araştırma, modellerin gerekli bilgilere erişebildiğini ancak bu bilgileri doğru bağlam içine yerleştiremediğini vurguluyor. Bu tablo, görevlerin tutarlı biçimde tamamlanmasını engelliyor. Tencent ekibi, bu durumu “yapısal bir uyumsuzluk” olarak tanımlıyor.
Bu kapsamda geliştirilen CL-Bench değerlendirmesi, modellerin bağlamdan öğrenme kapasitesini ölçmeyi hedefliyor. Toplam 19 farklı yapay zeka modeli, yüzlerce karmaşık senaryo üzerinden test edildi. Sonuçlar, güncel sistemlerin büyük bölümünün gerçek dünya karmaşıklığı karşısında düşük performans sergilediğini gösterdi.
Bağımsız test sonuçlarında, OpenAI tarafından geliştirilen GPT-5.1 modeli en yüksek genel performans puanını elde etti. Bu modeli, Anthropic’in Claude Opus 4.5 sistemi yakın bir puanla takip etti. Çin menşeili modeller arasında ise Moonshot AI firmasının Kimi K2 modeli, belirgin bir performans avantajıyla öne çıktı. Tencent’in kendi araştırmalarıyla geliştirdiği Hunyuan 2.0 modeli ise sıralamada orta dilimde konumlandı. Elde edilen bu veriler, büyük dil modelleri arasındaki performans farklılıklarının devam ettiğini ve mevcut teknolojinin olgunlaşması için hala kayda değer bir gelişim alanı bulunduğunu gösteriyor.
Tencent ekibi, bağlamdan öğrenme yeteneği gelişen sistemlerin insan-yapay zeka ilişkisini dönüştürebileceğini öngörüyor. İnsanların gelecekte yalnızca veri sağlayan aktörler değil, en doğru bağlamı tasarlayan rehberler haline gelmesi bekleniyor.
Buna karşın önemli bir sorun bulunuyor. Mevcut sistemlerde bağlamdan elde edilen bilgi, bağlam penceresi kapandığında kalıcı olmuyor. Araştırmacılar, gerçek dünya yapay zeka testleri kapsamında kalıcı öğrenmenin yalnızca olguları değil, becerileri ve deneyimleri de kapsayan daha derin bir süreci gerektirdiğini belirtiyor.
Yapay zeka bağlam öğrenme sorunu, önümüzdeki dönemde model mimarilerinin yeniden ele alınmasını zorunlu kılan temel başlıklardan biri olmayı sürdürüyor.

2 gün önce
4





























English (US) ·