Model AI Terbaru Google Menggunakan Browser Web Seperti yang Anda Gunakan

Google sedang memperkenalkan model AI Gemini baru yang dirancang untuk menjelajahi dan berinteraksi dengan web melalui browser, memungkinkan agen AI melakukan tugas di dalam antarmuka yang dirancang untuk digunakan oleh manusia, bukan robot. Model ini, yang disebut Gemini 2.5 Computer Use, menggunakan kemampuan pemahaman visual dan penalaran untuk menganalisis permintaan pengguna dan melaksanakan tugas, seperti mengisi dan mengirimkan formulir.

Menurut theverge.com, model ini dapat digunakan untuk pengujian antarmuka pengguna (UI) atau menavigasi antarmuka yang dirancang untuk manusia yang tidak memiliki akses ke API atau koneksi langsung lainnya. Versi lain dari model ini telah digunakan untuk fitur agen dalam AI Mode dan Project Mariner, prototipe penelitian yang menggunakan agen AI untuk menjalankan tugas secara mandiri di browser, seperti menambahkan item ke keranjang belanja berdasarkan daftar bahan.

Pengumuman Google ini datang sehari setelah OpenAI mengumumkan aplikasi baru untuk ChatGPT sebagai bagian dari acara Dev Day tahunannya, dan terus fokus pada fitur ChatGPT Agent yang dapat menyelesaikan tugas-tugas kompleks atas nama Anda. Sementara itu, Anthropic telah merilis versi model AI Claude-nya dengan fitur penggunaan komputer tahun lalu.

Google memposting beberapa video demo yang menunjukkan alat penggunaan komputernya dalam aksi, dan mencatat bahwa video tersebut dipercepat 3 kali lipat.

Google menyatakan bahwa model penggunaan komputernya melampaui alternatif terkemuka dalam berbagai uji kinerja web dan mobile. Berbeda.  dengan ChatGPT Agent dan alat penggunaan komputer Anthropic, model AI baru Google hanya memiliki akses ke browserbukan lingkungan komputer secara keseluruhan. Google mencatat bahwa model ini belum dioptimalkan untuk kontrol tingkat sistem operasi desktop dan saat ini mendukung 13 tindakan, termasuk membuka browser web, mengetik teks, serta menyeret dan melepas elemen.

Gemini 2.5 Computer Use tersedia bagi pengembang melalui Google AI Studio dan Vertex AI, tetapi juga ada demo di Browserbase, di mana Anda dapat melihatnya menyelesaikan tugas-tugas seperti Mainkan permainan 2048 atau Telusuri Hacker News untuk debat yang sedang tren.