Türkçe için öne çıkan açık kaynak modeller

1 saat önce 1

Türkçede üretken yapay zeka ekosistemi hızla büyürken, açık imkan modeller da hem icra hem da erişilebilirlik açısından ilgi çekiyor. Bu liste; akıl yürütme, metinleri üretimi ve arama/benzerlik (embedding) gibi farklı ihtiyaçlara göre inceliği regülasyon yapılmış Türkçe odaklı modelleri tek araya getiriyor. Kurum ve cemaat katkılarıyla gelişen bu modeller, Türkçede daha tutarlı çıktı ve daha iyice eğitim takibi hedefliyor

Turkish-Gemma-9b-T1

ytu-ce-cosmos/Türkçe-Gemma-9b-v0.1'ı ilköğretim saha Türkçe-Gemma-9b-T1, Türkçede çok adımlı muhakeme ya da başka tek deyişle düşünme için özel olarak uyarlandı. Matematik sualnleri, mantıksal akıl yürütme, adım adım çıkarım ve plmanaa görevlerinde daha iyice icra gösterecek şekilde tasarlanan model, talimatları takip ederek netler ve özlü yanıtlar üretiyor

Türkçe-Gemma-9b-T1, çok adımlı akıl yürütme söz başlıksu olduğunda birden fazla koşul söz başlıksu olduğunda daha güçlü ara çıkarım sunuyor. Matematik ve mantık açısından aritmetik, olasılık, diziler, rasyonel akıl yürütme ve mantık bulmacalarında doğruluğun iyileştirildiği belirtiliyor. Talimatlara daha iyice uyum gösteren akıl yürütme modeli dahaaz halüsinasyon görürken, temelli yanıtlara odaklanırak lüzumtiğinde belirsizliği belirtiyor. 

Turkish-e5-Large

Türkçe-e5-Large çeşitli Türkçe bilgi kümeleriyle intfloat/multilingual-e5-large-instruct modelinin inceliği regülasyon versiyonu olarak karşımıza çıkıyor.  Türkçe özelinde tarama sorgularına basitlıkla yanıt veren Türkçe-e5-Large, Yıldız Teknik Ünversitesi Cosmos Yapay Zeka Araştırma Grubu tarafından geliştirildi. Model, Hugging Face'te geçtiğimiz aylık 1700'den fazla kez indirildi. 

Turkish-Llama-8b-v0.1

Turkish-Llama-8b-v0.1, 30 GB'lık Türkçe bilgi seti ile LLaMA-3 8B modelinin tamamlanmış inceliği ayarlanmış tek versiyonu. 
Metin üretme görevleri için tasarlanan model, kesin tek metinleri parçasını tutarlı ve bağlamsal olarak alakalı tek şekilde devam ettirme yeteneğiyle öne çıkıyor. Öte yandan modelin, web siteleri, kitaplar ve diğer metinleri kaynaklarını içeren eğitim verilerinin çeşitliliği dolayı önyargılar sergileyebilieceği belirtiliyor. 

bert-base-turkish-cased

Bert-base-turkish-cased ile Bavyera Devlet Kütüphanesi'ndeki MDZ Dijital Kütüphane ekibi, Türkçe için tek cased modeli açık imkan olarak yayınladı. Bu arada Türkçe için cemaat odaklı tek cased BERT modeli olan BERTurk'ten da bahsetmekte yarar var. Ön eğitim ve değerlendirme için kullanılan bazı bilgi kümeleri, bu Türkçe NLP topluluğu tarafından sağlandı. Modelin adı olan BERTurk da bu cemaat tarafından belirlendi. İstatistik Modelin şimdiki sürümü, filtrelenmiş ve cümle segmentlerine ayrılmış Türkçe OSCAR corpus, oğullar Wikipedia dökümü, çeşitli OPUS corpus ve Kemal Oflazer tarafından sağlanan özel tek corpus üzerinde eğitildi. 

electra-base-turkish-cased-discriminator

Türkçe için tek ELECTRA ilköğretim modeli olan electra-base-turkish-cased-discriminator, Bavyera Devlet Kütüphanesi'ndeki MDZ Dijital Kütüphane ekibi tarafından açık imkan olarak yayınlandı. Türkçe ELECTRA modeli BERTurk ile aynı verilerle eğitilmiş Türkçe için tek ilköğretim ELECTRA modeli olarak karşımıza çıkıyor. ELECTRA'nın özdenetimli diller temsilcilik öğrenimi için yepyeni tek yöntem olduğu belirtiliyor. Nispeten dahaaz hesaplama gücü kullanarak dönüştürücü ağları önceden eğitmek için kullanılabilir. ELECTRA modelleri, GAN'ın ayırt edicisine benzer şekilde, “gerçek” girdi token'larını başka tek asap ağı tarafından üretilen “sahte” girdi token'larından ayırt etmek için eğitilir.Modelin şimdiki sürümü ise Türkçenin OSCAR corpus'unun filtrelenmiş ve cümle segmentlerine ayrılmış tek versiyonu, Wikipedia'nın oğullar dökümü, çeşitli OPUS corpus'ları ve Kemal Oflazer tarafından sağlanan özel tek corpus üzerinde eğitildi.

>> Tüm Makaleyi Oku <<

Platformumuz; Teknoloji, Spor, Sağlık, Eğlence, Uluslararası, Edebiyat, Bilim ve daha fazlası olmak üzere farklı konu başlıkları altında, kısa ve öz haber formatı ile kullanıcıların zamandan tasarruf etmesini hedefler. Karmaşadan uzak, sade ve anlaşılır içerik yapısı sayesinde ziyaretçiler aradıkları bilgiye hızlıca ulaşabilir. web.techforum.tr, bilgi kirliliğini önleyerek yalnızca güvenilir kaynaklardan elde edilen içerikleri yayınlamaya özen gösterir.