Yapay zeka dünyasında modeller arasındaki rekabet her geçen gün daha da dikkat çekici hale geliyor. Özellikle büyük teknoloji şirketlerinin geliştirdiği yeni nesil modeller, yalnızca metin üretme ya da soru yanıtlama becerileriyle değil, akıl yürütme, görsel algılama ve örüntü tanıma yetenekleriyle de karşılaştırılıyor.
Bu kapsamda yayımlanan yeni bir araştırma, 2026 yılının en akıllı yapay zeka modellerini IQ testindeki performanslarına göre sıraladı. Araştırmada, yapay zeka modellerinin Norveç Mensa IQ testinde elde ettiği sonuçlar değerlendirildi. Testte özellikle görsel örüntüleri tanıma ve soyut akıl yürütme becerileri öne çıktı.
Zirvede iki yapay zeka modeli yer aldı
Araştırmanın sonuçlarına göre listenin ilk sırasında iki model bulunuyor. Grok-4.20 Expert Mode ve OpenAI GPT 5.4 Pro Vision, 145 IQ puanıyla zirveyi paylaştı. Bu sonuç, yapay zeka modelleri arasındaki rekabetin geldiği noktayı göstermesi açısından dikkat çekti.
Listenin üçüncü sırasında ise 141 IQ puanıyla Gemini 3.1 Pro Preview yer aldı. Onu 139 IQ puanıyla OpenAI GPT 5.4 Thinking Vision takip etti. OpenAI GPT 5.3 modeli ise 136 IQ puanıyla ilk beş içerisinde kendine yer buldu.
Gemini, OpenAI ve Grok modelleri üst sıralarda
2026 sıralamasında Grok, OpenAI ve Google’ın Gemini ailesine ait modellerin üst basamaklarda yer alması dikkat çekti. Grok-4.20 Expert Mode’un 145 IQ puanıyla zirvede yer almasının ardından, aynı modelin Vision sürümü 133 IQ puanıyla altıncı sırayı paylaştı.
OpenAI tarafında ise GPT 5.4 Pro Vision, 145 IQ ile listenin en üstünde yer alırken, GPT 5.4 Thinking Vision 139, GPT 5.3 ise 136 IQ puanına ulaştı. OpenAI GPT 5.4 Thinking modeli de 133 IQ puanıyla üst sıralarda yer aldı.
Gemini 3.1 Pro Preview 141 IQ puanıyla üçüncü sıraya yerleşirken, Gemini 3.1 Pro Preview Vision 132 IQ puanıyla dokuzuncu sırada gösterildi. Gemini 3.1 Flash Preview ise 110 IQ puanıyla listenin orta sıralarında yer aldı.
Listenin dikkat çeken diğer modelleri
Araştırmada Meta Muse Spark, OpenAI GPT 5.4 Thinking ve Grok-4.20 Expert Mode Vision modelleri 133 IQ puanıyla aynı sırayı paylaştı. Qwen 3.5 ve Claude-4.6 Opus ise 130 IQ puanıyla listenin ilk 10 modeli arasında yer aldı.
Kimi K2.5 modeli 127 IQ puanıyla dikkat çekerken, Manus 115 IQ, DeepSeek R1 112 IQ ve DeepSeek V3 111 IQ puanıyla sıralamada kendilerine yer buldu. Llama 4 Maverick ve Gemini 3.1 Flash Preview modelleri de 110 IQ puanıyla aynı seviyede değerlendirildi.
Listenin devamında OpenAI GPT 5.3 Vision 109, Claude-4.6 Sonnet 106, Bing Copilot 101 ve Perplexity 97 IQ puanıyla sıralandı. Mistral Medium 3.1 modeli 96 IQ puanı alırken, Claude modellerinin Vision sürümlerinde daha düşük sonuçlar elde edildiği görüldü.
IQ testi tek başına yeterli ölçüt değil
Araştırmada üst sıralardaki modeller arasındaki farkların oldukça daraldığı ifade edildi. Birkaç puanlık değişimin bile sıralamada önemli farklılıklar yaratabildiği görülüyor. Ayrıca 2025 yılıyla karşılaştırıldığında, yapay zeka modellerinin IQ testlerindeki performanslarında belirgin bir yükseliş yaşandığı belirtiliyor.
Bununla birlikte uzmanlar, IQ testlerinin yapay zekaların genel kapasitesini bütünüyle ortaya koymadığını vurguluyor. Bu testler; kod yazma başarısı, güncel ve doğru bilgi sunma, araç kullanma becerisi ya da profesyonel iş süreçlerindeki performans gibi alanları ölçmüyor.
Yapay zekada yeni rekabet alanı
Tüm sınırlamalara rağmen söz konusu sıralama, yapay zeka modellerinin özellikle soyut akıl yürütme ve görsel örüntü tanıma alanındaki gelişimini göstermesi bakımından önemli kabul ediliyor. 2026 sonuçları, yapay zekada rekabetin artık yalnızca hız ya da metin üretim kalitesi üzerinden değil, daha karmaşık bilişsel beceriler üzerinden de şekillendiğini ortaya koyuyor.
Grok-4.20 Expert Mode ve OpenAI GPT 5.4 Pro Vision’ın 145 IQ puanıyla zirvede yer alması, yapay zeka modelleri arasındaki “en akıllı model” yarışının önümüzdeki dönemde daha da sertleşeceğini gösteriyor.