Mistral frappe fort: yeni model, NVIDIA ile iş birliği ve resmi kanıt aracı

Tek bir günde, Paris merkezli startup, küresel AI altyapısında vazgeçilmez bir yapı taşı olma hedefini doğrulayan üç büyük duyuru yaptı. İşte bu durumun somut etkileri.

Hatırlanması gerekenler:

Mistral Small 4, ilk kez akıl yürütme, çok modlu ve kod aracını tek bir modelde birleştiriyor, Apache 2.0 lisansı altında.
Mistral, Perplexity, Cursor ve Black Forest Labs ile birlikte NVIDIA'nın Nemotron koalisyonuna kurucu üye olarak katılıyor.
Leanstral, Lean 4 için resmi kanıtlar üretebilen ilk açık kaynaklı ajandır ve iddia edilen maliyet/performans oranı, genel rakiplerden 15 kat daha üstündür.
Bu üç duyuru, Mistral'ın artık ulusal bir alternatif olarak değil, küresel bir referans oyuncusu olarak kendini yeniden konumlandırdığını gösteriyor.

Small 4: Üç dağıtımı değiştiren bir model

Bugüne kadar, Mistral modellerini kullanmak isteyen teknik ekipler, Magistral'ı akıl yürütme için, Pixtral'ı görüntü işleme için, Devstral'ı kod aracılığı için seçmek zorundaydılar. Mistral Small 4, bu parçalanmayı sona erdiriyor.

Model, toplamda 119 milyar parametreye sahip bir Uzmanlar Karışımı (MoE) mimarisine dayanıyor, ancak her sorguda yalnızca 6 milyar aktif. Bu çalışma şekli, her çıkarımda hesaplama maliyetini sınırlarken, genel kapasiteyi korumaya olanak tanıyor. Mistral, Small 3 ile karşılaştırıldığında, %40 daha düşük gecikme ve optimize edilmiş bir yapılandırmada saniyede üç kat daha fazla sorgu sunuyor.

Bağlam penceresi 256.000 token ulaşarak, uzun belgeleri kesmeden işleme imkanı sunuyor. Model, hem metin hem de görüntüleri giriş olarak kabul ediyor.

Profesyonel kullanımlar için en dikkat çekici ekleme ise reasoning_effort parametresi. Kullanıcıya, Small 3'ün davranışına eşdeğer hızlı ve hafif bir yanıt ile daha derinlemesine, adım adım bir analiz arasında seçim yapma imkanı tanıyor. Dolayısıyla tek bir dağıtım, daha önce üç gerektiren ihtiyaçları karşılıyor.

Benchmarklarda, Mistral, akıl yürütme etkinleştirildiğinde Small 4'ün GPT-OSS 120B'yi eşitlediğini veya aştığını bildiriyor ve önemli ölçüde daha kısa çıktılar üretiyor. Daha kısa çıktılar, daha az gecikme, daha düşük çıkarım maliyetleri ve üretimde daha iyi bir kullanıcı deneyimi demek.

Model, Mistral API'si, Hugging Face ve yerinde dağıtımlar için optimize edilmiş NVIDIA NIM konteyneri olarak mevcut. Apache 2.0 lisansı altında yayımlanmış olup, yaygın çıkarım çerçeveleriyle uyumludur: vLLM, llama.cpp, SGLang ve Transformers.

Nemotron koalisyonu: Mistral büyüklerin masasında

Bu muhtemelen günün en stratejik duyurusu. Mistral, NVIDIA'nın Nemotron koalisyonuna kurucu üye olarak katılıyor, Cursor, Perplexity, Black Forest Labs ve Mira Murati laboratuvarı ile birlikte.

Bu koalisyonun amacı, bir açık kaynak temel model co-geliştirmek, Nemotron 4, NVIDIA'nın DGX bulutunda eğitilecek. Model daha sonra tüm endüstrinin özelleştirmesi için açık kaynak olarak yayımlanacak. Her üye, Mistral için çok dilli ve model mimarisi, Perplexity için araştırma, LangChain için orkestrasyon, Black Forest Labs için çok modluluk gibi tamamlayıcı bir uzmanlık getiriyor.

Mistral için bu, NVIDIA'nın hesaplama altyapısına erişim anlamına geliyor ve bu sayede kendi başına finanse edemeyeceği ölçekte modeller eğitebilecek. Karşılığında, startup, eğitim tekniklerini, çok modlu yeteneklerini ve işletmeye yönelik ince ayar araçlarını sunuyor.

Endüstriyel mantık net. OpenAI ve Google'ın kapalı ekosistemlerine karşı, bu koalisyon, açık kaynak kampını koordine bir güç olarak yapılandırıyor. NVIDIA için, çipleri için optimize edilmiş bir referans modeli, donanım talebini mekanik olarak artırıyor.

Bu ittifak, gerilim olmadan değil. Nemotron 4'ün eğitileceği DGX bulutu NVIDIA'ya ait. Mistral bunu iyi anladı: şirket, Fransa ve İsveç'te kendi hesaplama yeteneklerine yatırım yapıyor, böylece bu ortaklık stratejik bir seçim olarak kalıyor ve zorunlu bir bağımlılık haline gelmiyor. Teknolojik egemenlik sorusu hala gündemde: Mistral, ABD'nin yurtdışı düzenlemelerine tabi bir aktörle bağını güçlendiriyor.

Leanstral: AI'nın doğru olduğunu kanıtlaması

Üçüncü duyuru en teknik olanıdır. Bugün sınırlı bir kitleye hitap ediyor, ancak ajans sorununa dair temel bir meseleyi ele alıyor.

Leanstral'ın çözmeye çalıştığı sorun

Bugün bir AI ajansı kod ürettiğinde, sonuç olasılıksaldır. Kod doğru görünür, testleri geçer, ancak kesin bir garanti yoktur. Doğrulama, insanlara dayanır; onlar tekrar okur, test eder ve düzeltir. Ajanslar daha hızlı üretim yaptıkça, bu insan tıkanıklığı kritik hale gelir.

Bu sorunun bir çözümü vardır: resmi kanıt. Lean 4 gibi bir kanıt asistanı, bir geliştiricinin yalnızca bir program yazmasına değil, aynı zamanda onun matematiksel kanıtını da yazmasına olanak tanır. Eğer kanıt geçerliyse, kodun doğru olduğu garanti edilir; "muhtemelen doğru" değil, "test edilen durumlarda doğru" değil, ancak matematiksel anlamda doğru. Lean 4, karmaşık kanıtları biçimlendirmek için matematikçiler ve kritik yazılımları sertifikalandırmak için mühendisler tarafından kullanılmaktadır.

Sorun, Lean 4'te kanıt yazmanın uzmanlık gerektiren, yavaş ve zahmetli bir iş olmasıdır. İşte Leanstral'ın doldurmaya çalıştığı boşluk budur.

Leanstral'ın somut olarak yaptığı şey

Leanstral, 6 milyar aktif parametreye sahip bir AI ajansı, resmi kanıtlar üretmek için özel olarak eğitilmiştir. Sadece kod üretmekle kalmaz: bu kodu sertifikalandıran kanıtı da üretir. Lean 4 daha sonra bu kanıtı doğrular. Eğer geçersizse, reddedilir. Doğrulayıcı yolsuzluk yapamaz.

Bu, Lean 4 için bu türdeki ilk açık kaynaklı ajandır. Mevcut sistemler ya genel modeller etrafında katmanlar oluşturur ya da izole matematiksel sorunlarla sınırlıdır. Leanstral, gerçek resmi havuzlarda çalışmak üzere tasarlanmıştır, seyrek bir mimari ve kanıt görevlerine özel bir optimizasyon ile.

Benchmarklar ve sınırlamaları

FLTEval'da, kendi değerlendirme setlerinde, Leanstral 36 dolara 26,3 puan alıyor (pass@2), Claude Sonnet 4.6 için 549 dolara 23,7 puan alıyor. pass@16'da, Leanstral 31,9 puan alıyor ve Sonnet'i 8 puan geride bırakıyor. Claude Opus 4.6, 39,6 puanla mutlak kalitede en iyi durumda, ancak 1.650 dolara, yani 92 kat daha pahalı.

Bu rakamlar dikkatli bir okuma gerektiriyor. FLTEval, üçüncü taraflarca tekrarlanmayan bir iç benchmarktır. 6 milyar aktif parametreye sahip bir özel model ile büyük genel modeller arasındaki maliyet karşılaştırması tarafsız değildir: bu, belirli bir göreve optimize edilmiş bir araç ile İsviçre çakısı karşılaştırmasıdır. Leanstral'ın değerlendirildiği matematiksel FLT projesinin ötesine geçme yeteneği henüz kanıtlanmamıştır. Son olarak, tüm testler Mistral Vibe ortamında gerçekleştirilmiştir.

Neden matematiklerin ötesinde önemlidir

Gerçek mesele, özerk ajanslara olan güven. Bugün, bir AI ajansı kod yazar ve veriler üzerinde işlem yapar, her satırın doğrulanması olmadan. Kodu tam olarak ne yapması gerektiğini resmi olarak kanıtlayabilen bir ajans, durumu değiştirir: insan beklenen sonucu belirtir, makine bunun üretildiğini kanıtlar. Denetim, satır satır doğrulamadan, spesifikasyonların tanımına kayar.

Leanstral, Mistral Vibe aracılığıyla hemen mevcut (komut /leanstall), ücretsiz bir API (labs-leanstral-2603) aracılığıyla ve Apache 2.0 lisansı altında ağırlıkları doğrudan indirerek erişilebilir.

Kesin bir stratejik yeniden konumlandırma

Bu üç duyuru bir arada okunduğunda, yalnızca izole ürün çıkışları değildir. Bir yol haritasını tanımlar.

Small 4, çok yönlü, performanslı ve tasarruflu bir model ile işletme pazarını kapsar.
Nemotron koalisyonu, Mistral'a açık kaynaklı AI'nın küresel standartlarının belirlenmesinde bir varlık kazandırıyor.
Leanstral, sohbet modellerinin ötesinde bir AR-GE derinliğini gösteriyor.

Mistral, bu yıl bir milyar euro ciro hedefliyor, İsveç'te bir veri merkezi inşa ediyor, Ocak ayında Savunma Bakanlığı ile sözleşme imzaladı ve Şubat'ta Koyeb'i satın aldı. Tüm bunları, Apache 2.0 lisansı ile tutarlı bir açık kaynak politikası sürdürerek gerçekleştiriyor. Açık kalan soru, sürdürülebilirliktir: Hiper büyüme yaşayan bir şirket, modellerini ücretsiz olarak yayımlamaya ne kadar süre devam edebilirken, bunları eğitmek için gerekli devasa altyapıyı finanse edebilir?

Yorumlar

(3 Yorum)

EY

Ekin Yıldırım

Mistral Small 4'ün çok modlu yetenekleri gerçekten etkileyici. Tek bir modelde bu kadar çok işlevsellik sunması, AI dünyasında büyük bir devrim yaratabilir.
ZK

Zeynep Korkmaz

Nemotron koalisyonu hakkında daha fazla bilgi almak isterim. Bu ortaklık gerçekten endüstriyi nasıl etkileyecek?
KŞ

Kara Şimşek

Leanstral'ın resmi kanıt üretme yeteneği, yazılım geliştirme süreçlerini hızlandırabilir. Ancak, bu sistemin güvenilirliği ne kadar sağlanacak?