Hoşgeldiniz!

Eksik parçanızı buldunuz artık sizde paylaşılan bilgilerden yararlanabilecek, paylaşımda bulunabilecek ve özel mesaj gönderebileceksiniz..

Hemen Kayıt Olmak İçin Tıklayın!

En Zeki Yapay Zekâ Hangisi? İşte Gemini 3 Pro, GPT 5.1, Grok 4 Gibi Popüler Dil Modellerinin Karşılaştırma Sonuçları

Moderatör
Ticaret Puanı: 0 / 0 / 0
Katılım
11 Haz 2023
Mesajlar
35,601
ABD merkezli teknoloji teknoloji devi Google, dün akşam düzenlediği bir etkinlikte Gemini 3 ailesini tanıttı. Şirketin yeni yapay zekâ modeli, gelişmiş özellikleri ve en çok da yüksek performansıyla dikkatleri üzerine çekti. Gemini 3, girdiği tüm performans testlerinde rakiplerini ezip geçmiş durumda.

Bu içeriğimizde Gemini 3'ün rakipleriyle girdiği tüm performans testlerine ve elde ettiği sonuçlara yakından bakacağız. Peşin peşin söyleyelim: Bu verileri gördükten sonra Gemini'a olan bakış açınız tümüyle değişecek. Dilerseniz lafı daha fazla uzatmadan detaylara geçelim.

Google Gemini 3'ün performans testi sonuçları:​


Başlıksız-1


Yukarıdaki tablo, Google DeepMind ekibinin paylaştığı verileri ortaya giriyor. Google Gemini, yukarıda gördüğünüz neredeyse tüm testlerde rakiplerini alt etti. Gelin şimdi bu testleri biraz detaylandıralım. Küresel çapta önemli kabul edilen performans testlerinin ne dediğine hep birlikte bakalım.

Başlıksız-1


Yukarıda, yapay zekâ sektörünün en popüler performans testlerinden Humanity's Last Exam sonuçları yer alıyor. Gemini 3 Pro modeli, yüzden fazla konuda 2.500 zorlayıcı sorudan oluşan bu performans testinde GPT ve Sonnet gibi rakiplerine aman vermiyor. Gemini 3 Deep Think ise Gemini 3 Pro'yu da geçmiş durumda.

Başlıksız-1


Bakın bu da önemli bir test. Gemini 3 ailesi, bu testte "yapay zekâ modelleri kârlı bir işletmeyi nasıl yönetir?" sorusunu cevapladı. Gemini 3 Pro, 5.500 dolarlık kazanç ile en yakın rakibi olan Sonnet'ten çok daha iyi bir sonuç verdi.

Başlıksız-1


Yukarıda gördüğünüz test, yapay zekâ modellerinin halüsinasyon görme olasılığını ölçtüğü için oldukça önemli. Ve görebileceğiniz üzere Gemini 3 Pro, SimpleQA Verified isimli bu testte en iyi performansı göstermiş durumda. Ancak Google, bu meseleyi zaten Gemini 2.5 ile aşmıştı.

Başlıksız-1


Yukarıdaki ekran görüntüsü ise 10 farklı testi içeren Artificial Analysis Intelligence Index tablosunu ortaya koyuyor. Daha önce piyasaya sürülen yapay zekâ araçlarında genelde 1 veya 2 puan farkla iyileşme olurken Gemini 3 Pro, GPT 5.1'i 3 puan farkla geçti. Gemini 2.5 Pro ile Gemini 3 Pro arasındaki fark da gerçekten dikkate değer.

Başlıksız-1


Yukarıdaki ekran görüntüsü ise yine yapay zekâ modellerinin genel zekâ durumunu ölçen, ödüllü ARC-AGI-2 testine ait sonuçlar. Gemini, artık rakiplerinin yetişemeyeceği bir seviyeye ulaşmış durumda.

Gemini 3'ün özelliklerine ilişkin detaylı bilgi için:


Yukarıda gösterdiğimiz test sonuçlarıyla ilgili fikirlerinizi merakla bekliyoruz. Ne diyorsunuz, Google yapay zekâ işini çözdü mü?

 
Üst