Google dapat mempratinjau konsep model aksi besar Rabbit secepatnya pada bulan Desember, lapor The Information. “Project Jarvis,” demikian nama kode yang dilaporkan, akan melaksanakan tugas-tugas untuk pengguna, termasuk ‘mengumpulkan riset, membeli produk, atau memesan penerbangan,’ menurut tiga orang yang berbicara dengan outlet tersebut yang memiliki pengetahuan langsung tentang proyek tersebut.
Didukung oleh versi masa depan Google Gemini, Jarvis dilaporkan hanya bekerja dengan peramban web (disetel secara khusus untuk Chrome). Alat ini ditujukan untuk membantu orang “mengotomatisasi tugas sehari-hari berbasis web” dengan mengambil dan menafsirkan tangkapan layar dan kemudian mengklik tombol atau memasukkan teks, tulis The Information. Dalam kondisi saat ini, tampaknya dibutuhkan beberapa detik di antara tindakan.
Menurut theverge.com, perusahaan-perusahaan AI terbesar semuanya bekerja pada model yang melakukan hal-hal seperti yang dijelaskan oleh The Information. Copilot Vision dari Microsoft akan memungkinkan Anda berbicara dengannya tentang halaman web yang Anda lihat. Apple Intelligence diharapkan dapat mengetahui apa yang ada di layar Anda dan melakukan berbagai hal untuk Anda di berbagai aplikasi di tahun depan. Anthropic memulai debutnya dengan pembaruan beta Claude yang “tidak praktis dan rentan terhadap kesalahan” yang dapat menggunakan komputer untuk Anda, dan OpenAI dilaporkan sedang mengerjakan versi yang sama.
The Information memperingatkan bahwa rencana Google untuk memamerkan Jarvis pada bulan Desember dapat berubah. Perusahaan dilaporkan mempertimbangkan untuk merilisnya ke sejumlah kecil penguji untuk menemukan dan membantu perusahaan mengatasi bug.