Model Gemini Pro Terbaru Google Kembali Mencetak Skor Benchmark Tertinggi

Pada hari Kamis, Perusahaan Google dikabarkan telah merilis versi terbaru Gemini Pro, model bahasa besar (LLM) yang sangat canggih. Model 3.1 saat ini tersedia sebagai versi pratinjau dan akan segera dirilis secara umum, kata perusahaan tersebut.

Menurut techcrunch.com, Model baru Google ini mungkin menjadi salah satu LLM paling canggih hingga saat ini. Pengamat mencatat bahwa Gemini 3.1 Pro tampaknya merupakan lompatan besar dari pendahulunya, Gemini 3 yang, saat diluncurkan pada November, sudah dianggap sebagai alat AI yang sangat mumpuni. Pada Kamis, Google juga membagikan statistik dari uji benchmark independen seperti yang disebut Humanity’s Last Exam, yang menunjukkan kinerjanya jauh lebih baik dibandingkan versi sebelumnya.

Gemini 3.1 Pro juga mendapat pujian dari Brendan Foody, CEO startup AI Mercor, yang sistem benchmarking-nya, APEX, dirancang untuk mengukur seberapa baik model AI baru dalam menjalankan tugas profesional nyata. “Gemini 3.1 Pro kini berada di puncak papan peringkat APEX-Agents,” kata Foody dalam posting media sosialnya, menambahkan bahwa hasil impresif model tersebut menunjukkan “seberapa cepat agen-agen ini berkembang dalam pekerjaan pengetahuan nyata.”

Peluncuran ini terjadi saat persaingan model AI semakin memanas, dan perusahaan teknologi terus merilis LLM yang semakin kuat yang dirancang untuk pekerjaan agen dan penalaran multi-langkah. Nama-nama besar lainnya seperti OpenAI dan Anthropic juga baru-baru ini merilis model baru.