Google umumkan Gemini 3.1 Pro, raih skor benchmark tertinggi

Peluncuran Gemini 3.1 Pro, Model Bahasa Besar Terbaru dari Google

Perusahaan teknologi Google baru saja meluncurkan versi terbaru dari Large Language Model (LLM) mereka, yaitu Gemini 3.1 Pro. Model yang dirilis pada hari Kamis ini tersedia dalam bentuk pratinjau dan akan segera dirilis secara umum dalam waktu dekat. Dengan kemampuan yang dianggap sangat kuat, model ini menempati posisi penting dalam dunia pengembangan kecerdasan buatan.

Gemini 3.1 Pro dinilai sebagai salah satu LLM paling canggih hingga saat ini. Banyak pengamat mengatakan bahwa model ini memberikan lompatan signifikan dibanding pendahulunya, Gemini 3, yang telah diakui sebagai alat AI yang sangat mumpuni ketika diluncurkan pada November lalu. Dalam kesempatan peluncuran, Google juga membagikan statistik dari berbagai benchmark independen, termasuk Humanity’s Last Exam, yang menunjukkan bahwa performa Gemini 3.1 Pro jauh lebih baik daripada versi sebelumnya.

Pujian juga datang dari Brendan Foody, CEO startup AI Mercor. Ia menyebut bahwa Gemini 3.1 Pro kini berada di puncak papan peringkat APEX-Agents. Menurut Foody, capaian ini menunjukkan seberapa cepat agen meningkat dalam menjalankan tugas pengetahuan nyata. Sistem benchmarking APEX yang dikembangkan oleh Mercor dirancang untuk mengukur seberapa baik model AI baru menjalankan tugas profesional di dunia nyata.

Peluncuran Gemini 3.1 Pro terjadi di tengah persaingan yang semakin ketat dalam pengembangan model AI. Berbagai perusahaan teknologi terus merilis LLM yang semakin kuat, terutama untuk mendukung pekerjaan berbasis agen dan penalaran multi-langkah. Selain Google, beberapa perusahaan besar lain juga telah meluncurkan model terbaru mereka dalam beberapa waktu terakhir.

Keunggulan Gemini 3.1 Pro

Dari laman resmi Google, versi 3.1 Pro membawa mesin penalaran canggih yang sebelumnya diperkenalkan lewat Gemini 3 Deep Think ke cakupan pengguna yang lebih luas. Model ini dirancang untuk menangani persoalan yang tidak cukup dijawab secara sederhana.

Dalam praktiknya, Gemini 3.1 Pro mampu merangkum dan menyatukan dataset besar menjadi satu gambaran utuh, membuat SVG (Scalable Vector Graphics) animasi langsung dari perintah teks, serta menyelesaikan persoalan teknis dan ilmiah yang kompleks dan bertingkat. Khusus untuk SVG animasi, hasil dibuat dalam bentuk kode murni sehingga tetap tajam di berbagai ukuran dengan ukuran file yang lebih ringkas dibandingkan format video konvensional.

Performa Gemilang di Berbagai Benchmark

Dari sisi performa, Gemini 3.1 Pro mencatat lonjakan signifikan di berbagai benchmark. Model ini meraih skor 77,1 persen pada ARC-AGI-2, lebih dari dua kali lipat capaian Gemini 3 Pro. Selain itu, ia membukukan 94,3 persen pada GPQA Diamond untuk pengetahuan ilmiah, 80,6 persen pada SWE-Bench Verified untuk pengkodean berbasis agen, serta 85,9 persen pada BrowseComp untuk pencarian berbasis agen. Di LiveCodeBench Pro untuk competitive coding, model ini mencatat rating Elo 2887, melampaui sejumlah pesaingnya.

Post Views: 4

Peluncuran Gemini 3.1 Pro, Model Bahasa Besar Terbaru dari Google

Keunggulan Gemini 3.1 Pro

Performa Gemilang di Berbagai Benchmark

Pos terkait

Jaringan Social