LANSMAN
14 Aralık 2025

Tanıtıyoruz: MaariFx 6KFL

MaariFx'in ilk test modeli 6KFL, fizik sorularında dünyanın en büyük yapay zeka modellerini geride bırakarak gücünü kanıtladı.

MaariFx, öğrencilerin çözemedikleri soruların fotoğrafını çekip yapay zekaya yükleyerek adım adım animasyonlu video çözüm aldıkları bir platform. Ama böyle bir platformun kalbinde güçlü bir model olması gerekiyordu. İşte 6KFL, bu modelin ilk versiyonu. Üretime hazır bir sürüm değil; daha çok hangi eğitim stratejilerinin ve veri formatlarının en iyi sonucu vereceğini keşfetmek için geliştirilmiş bir deneysel yapı taşı.

6KFL yaklaşık 40 milyon token ile eğitildi. Model eğitimi sürecinde loss değeri 0.0108'e, evaluation loss ise 0.0109'a düştü. Bu iki değer arasındaki minimum fark, modelin eğitim verisini ezberlemeden güçlü bir genelleme kapasitesi kazandığını gösteriyor. Mean token accuracy ise %99.9 seviyesine ulaştı. Kısacası model, daha önce görmediği sorularda bile tutarlı ve doğru çözümler üretebilecek bir seviyeye geldi.

6KFL'nin özellikle dikkat çeken bir yanı, samimi ve pedagojik anlatım tarzı. Soruları soğuk ve teknik bir şekilde çözmek yerine, bir öğretmenin yanınızda oturup anlatması gibi doğal bir dil kullanıyor. Her adımda neden o işlemin yapıldığını açıklıyor, formüllerin nereden geldiğini anlatıyor. Bu da çözümü sadece görmek değil, gerçekten anlamak isteyen öğrenciler için büyük bir fark yaratıyor.

Peki 6KFL gerçekten ne kadar iyi? Bunu ölçmek için modeli 10 fizik sorusundan oluşan bir benchmark testine soktuk. Sorular Kuvvet ve Hareket, Enerji, Elektrik ve Dalgalar ünitelerinden seçildi. Aynı soruları dünyanın en güçlü yapay zeka modellerine de sorduk. Sonuçlar şöyle:

Fizik Benchmark Sonuçları

10 fizik sorusu — Kuvvet ve Hareket, Enerji, Elektrik, Dalgalar

Claude Opus 4.5
9/10
MaariFx 6KFL
8/10
Gemini 2.5 Pro
7/10
ChatGPT 5.1
7/10
DeepSeek V3.2
7/10

Sonuçlar oldukça dikkat çekici. MaariFx 6KFL, Google'ın Gemini 2.5 Pro'sunu, OpenAI'ın ChatGPT 5.1'ini ve DeepSeek V3.2'yi 1 soru farkla geride bıraktı. Yalnızca Anthropic'in Claude Opus 4.5'inin 1 soru gerisinde kaldı. Bir test modeli için bu, son derece umut verici bir başlangıç.

Tabii bu testin sınırlılıklarını da belirtmek gerekiyor. 10 soruluk bir benchmark, bir modelin performansını tam anlamıyla yansıtmaz. Daha geniş soru havuzları ve farklı zorluk seviyeleriyle yapılacak kapsamlı testler, gerçek tabloyu daha net ortaya koyacaktır. Yine de 6KFL'nin bu ilk testteki performansı, MaariFx'in gelecekteki sürümleri için güçlü bir temel oluşturduğunu açıkça gösteriyor.

MaariFx'i deneyin

MaariFx'e Git