Yapay zeka devi OpenAI'ın Codex için yeni bir macOS uygulaması piyasaya sürdüğünü sizlere aktarmıştık. Şimdi de OpenAI, Codex'i hızlandıracak nitelikte olan yeni modeli GPT-5.3 Codex'i piyasaya sürdü.
Şirketin belirttiğine göre; GPT-5.3-Codex, Codex'i sadece kod yazıp gözden geçirebilen bir ajandan, geliştiriciler ve profesyonellerin bilgisayarda yaptıkları neredeyse her şeyi yapabilen, yazılım geliştirebilenlerin sayısını ve işlerin yapılma şeklini genişleten bir ajana dönüştürüyor.
Modelin yetenekleri, hata ayıklama, dağıtım, izleme, ürün gereksinim belgeleri yazma, metin düzenleme, kullanıcı araştırması yapma, slayt sunumları oluşturma ve elektronik tablo uygulamalarında veri analizi yapmayı içeriyor. Ayrıca OpenAI'ın aktardıklarına göre GPT-5.3-Codex, birkaç gün içinde sıfırdan son derece işlevsel karmaşık oyunlar ve uygulamalar oluşturabiliyor. Hareket alanındaki bu genişleme, OpenAI'ın sadece geliştirici araçları pazarının ötesinde daha geniş kurumsal üretkenlik yazılımı alanını da sahiplenmeye başladığını gösteriyor.
Paylaşılan bilgilere göre GPT-5.3 Codex, önceki model olan GPT-5.2'den yüzde 25 daha hızlı. OpenAI'ın kendi kendini yaratmada etkili olan ilk modeli olarak tanıtılan GPT-5.3 Codex'in erken aşama sürümleri şirketin çalışanları tarafından da deneyimlendi. Codex ekibi GPT-5.3-Codex'in ilk sürümlerini kendi eğitim çalışmalarının hata ayıklamasını yapmak, dağıtım altyapısını yönetmek ve test sonuçlarını ve değerlendirmeleri analiz etmek için kullandı. Sam Altman X gönderisinde şu ifadelere yer verdi:
5.3-Codex'i kullanarak 5.3-Codex'i ne kadar hızlı sunabildiğimizi görmek inanılmazdı ve bu kesinlikle gelecekte olacakların bir işareti.

GPT-5.3-Codex, dört programlama dilini kapsayan ve gerçek dünya yazılım mühendisliğinin değerlendirmesi olan SWE-Bench Pro'da yüzde 57 puan elde etti. Kodlama ajanları için gerekli olan terminal becerilerini ölçen Terminal-Bench 2.0'da yüzde 77,3, modellerin görsel masaüstü ortamlarında üretkenlik görevlerini tamamlaması gereken ajansel bilgisayar kullanımı benchmark'ı OSWorld'de ise yüzde 64 puan aldı.

Bu arada GPT-5.3-Codex, Terminal-Bench 2.0'de yüzde 77,3 puan alırken, GPT-5.2-Codex yüzde 64,0 ve temel GPT-5.2 modeli yüzde 62,2 puan aldı. Şirketin belirttiğine göre, GPT-5.3-Codex bu performansı önceki modellerden daha az token kullanarak ortaya koyuyor.
Yakın zamanda Anthropic'in OpenAI'a yapay zeka reklamları konusunda göndermede bulunmasıyla ivme kazanan rekabet, model yayınlama süreçlerinde de kendini göstermeye başladı. Anthropic'in Opus 4.6 modeli, OpenAI'ın GPT-5.3-Codex modeliyle aynı saatte tanıtılacakken, Anthropic piyasaya sürülme tarihini 15 dakika öne alarak modelleri tanıtma yarışında OpenAI'ı biraz geride bıraktı

4 gün önce
4





























English (US) ·