Daftar Skor IQ AI 2026: Siapa yang Paling Pintar di Dunia Artificial Intelligence?

Daftar Skor IQ AI 2026: Siapa yang Paling Pintar di Dunia Artificial Intelligence?

Sumber Foto : Istimewa


Perusahaan-perusahaan kecerdasan buatan (artificial intelligence/AI) seperti OpenAI dan Anthropic terus bersaing menghadirkan model yang semakin canggih. Setiap kali merilis model terbaru, mereka biasanya juga mempublikasikan hasil benchmark untuk menunjukkan keunggulan masing-masing.

Hal serupa dilakukan Tracking AI, sebuah platform yang secara khusus menguji dan membandingkan performa berbagai model AI.

Platform ini mengukur “tingkat kecerdasan” model AI menggunakan tes IQ, lalu hasilnya divisualisasikan oleh Visual Capitalist, media independen yang dikenal dengan infografis berbasis data. Pengujian dilakukan pada April 2026 menggunakan tes IQ Mensa Norwegia dengan melibatkan sedikitnya 26 model AI dari berbagai perusahaan dan versi.

Hasilnya menunjukkan persaingan yang sangat ketat. Dua model berada di posisi teratas dengan skor yang sama, yaitu Grok-4.20 Expert Mode dan OpenAI GPT-5.4 Pro (Vision), keduanya meraih skor 145. Dibawahnya terdapat Gemini 3.1 Pro Preview dengan skor 141.

Jika dilihat lebih rinci, berikut daftar lengkap peringkat model AI berdasarkan skor IQ:

Skor tertinggi

  • Grok-4.20 Expert Mode — 145
  • OpenAI GPT-5.4 Pro (Vision) — 145

Sangat tinggi

  • Gemini 3.1 Pro Preview — 141
  • OpenAI GPT-5.4 Thinking (Vision) — 139
  • OpenAI GPT-5.3 — 136

Tinggi

  • Grok-4.20 Expert Mode (Vision) — 133
  • OpenAI GPT-5.4 Thinking — 133
  • Meta Muse Spark — 133
  • Gemini 3.1 Pro Preview (Vision) — 132
  • Qwen 3.5 — 130
  • Claude 4.6 Opus — 130

Menengah atas

  • Kimi K2.5 — 127
  • Manus — 115
  • DeepSeek R1 — 112
  • DeepSeek V3 — 111
  • Gemini 3.1 Flash — 110
  • Llama 4 Maverick — 110
  • GPT-5.3 (Vision) — 109
  • Claude 4.6 Sonnet — 106

Menengah ke bawah

  • Bing Copilot — 101
  • Perplexity — 97
  • Mistral Medium 3.1 — 96
  • Claude 4.6 Sonnet (Vision) — 94
  • Claude 4.6 Opus (Vision) — 82
  • Llama 4 Maverick (Vision) — 79
  • GPT-5.4 Pro (non-vision) — 73

Tes Mensa Norwegia yang digunakan terdiri dari 35 soal pola visual. Terdapat perbedaan metode antara model berbasis teks dan multimodal. Model non-vision menerima soal dalam bentuk deskripsi verbal, sedangkan model vision mengerjakan langsung dari gambar asli tanpa modifikasi.

Tracking AI juga menerapkan aturan khusus, di mana jika sebuah model menolak menjawab, pertanyaan akan diulang hingga maksimal 10 kali dan jawaban terakhir yang diambil sebagai hasil penilaian. Meski demikian, skor ini hanya bersifat perbandingan performa dan bukan ukuran mutlak kecerdasan AI secara keseluruhan, karena tes IQ hanya mengukur satu aspek, yaitu kemampuan penalaran pola.




AIAI 2026

Share to:



Modal Video 01