Neden önemli: Yapay zeka alanında Türkiye’nin kendi modelini geliştirmesi, teknoloji bağımsızlığı açısından kritik bir adım. Ayrıca, Türkçe’ye özel mimarisi sayesinde Kumru LLM yerel işletmelere küresel düzeyde rekabet gücü kazandırıyor. Üstelik, düşük maliyetli kurulumu kurumlara erişilebilir yapay zeka çözümleri sunuyor.
Türk yazılım sektörünün önde gelen firmalarından VNGRS, Türkiye’nin ilk yerli büyük dil modeli olan Kumru LLM’i tanıttı. Tamamen Türkçe dil desteği kullanılarak sıfırdan geliştirilen model toplamda 7.4 milyar parametre içeren model Türk yapay zeka ekosisteminde önemli bir dönüm noktası olarak değerlendiriliyor. Sadece 16 GB VRAM kapasiteli grafik kartlarında bile verimli şekilde çalışabilen model bu alanda da adından söz ettiriyor.
Kumru LLM Türkçe için özel mimariyle geliştirildi
Uzmanlar, Kumru LLM’i 45 gün süren bir eğitim sürecinde 500 GB temiz veriyle eğitti. Bu süreçte H100 ve H200 GPU’ları kullandı. VNGRS, modelin yalnızca Türkçe için eğitildiğini, ardından 1 milyon örnek içeren bir veri karışımıyla ince ayar uygulandığını açıkladı. Aynı zamanda Kumru, Mart 2024’e kadar olan bilgilere sahip durumda.
Ekip, modeli Mistral-v0.3 mimarisi üzerine inşa etti. Aynı zamanda tasarım sürecinde LLaMA-3 teknik belgelerinden yararlandılar. 8.192 tokenlik bağlam uzunluğuna sahip olan Kumru, yaklaşık 20 A4 sayfasına denk gelen metinleri tek seferde işleyebiliyor. Bu özellik, özellikle belge işleme ve özetleme görevlerinde verimlilik sağlıyor.
Kurumsal kullanımda maliyet avantajı sunuyor
Kumru LLM, yerel sunucularda çalışabilmesi sayesinde kurumlara güvenli konumlandırma olanağı tanıyor. VNGRS’ye göre, Kumru’nun kurum içi kurulum maliyeti yaklaşık 2.000 dolar seviyesinde. Aynı kapasitedeki yabancı modeller ise bu maliyeti 30.000 dolara kadar çıkarıyor.
Uzmanlar Kumru-2B’yi ana modelin daha kompakt bir varyantı olarak 2 milyar parametreyle tasarladı. Yalnızca 4.8 GB bellek gereksinimi duyan bu sürüm, düşük kaynaklı ortamlarda çalışabiliyor. Mobil cihazlarda da esnek kullanım imkânı sağlıyor. Hugging Face platformunda erişime açılan model, yerli geliştiricilere kolay test olanağı sağlıyor. Ayrıca prototip geliştirme sürecini belirgin biçimde hızlandırıyor.
Türkçe görevlerde yüksek başarı gösteriyor
Kumru’nun bağımsız test sonuçları, modelin Türkçe dil görevlerinde uluslararası rakiplerine kıyasla üstün performans sergilediğini gösterdi. Ayrıca yerli model, Gemma-3-27B, LLaMA-3.3-70B, Qwen-2-72B ve Aya-32B gibi daha büyük parametreye sahip uluslararası modelleri Türkçe metin işleme ve anlama testlerinde geride bıraktı.
Kumru, dilbilgisi düzeltme, metin özetleme ve soru-cevap gibi temel görevlerde yüksek doğruluk sağlıyor. Aynı zamanda model, Türkçe’nin yapısal karmaşıklığını etkili biçimde işleyebiliyor. Modelin performansı büyük ölçüde, Türkçe’ye özgü geliştirilen tokenizasyon sistemine dayanıyor. RegEx tabanlı ön işlemci, satır sonlarını ve noktalama işaretlerini ayrı token’lara dönüştürüyor. Bu sayede metin işleme verimliliği artıyor. Bu yaklaşım, metinlerin %38 ile %98 arasında daha az token kullanılarak işlenebilmesini sağlıyor.
Kumru’nun herkese açık demo sürümü kumru.ai adresi üzerinden erişime açıldı. Yerli yapay zeka araştırmalarına öncülük eden modelin, gelecekte farklı sektörlere yönelik özelleştirilmiş sürümlerinin geliştirileceği belirtiliyor.
