OpenAI sedang bertaruh besar pada kecerdasan buatan (AI) audio, dan ini bukan hanya tentang membuat ChatGPT terdengar lebih baik. Menurut laporan terbaru dari The Information, perusahaan telah menggabungkan beberapa tim teknik, produk, dan penelitian selama dua bulan terakhir untuk merombak model audio mereka, semua sebagai persiapan untuk perangkat pribadi berbasis audio yang diharapkan diluncurkan dalam sekitar setahun.
Menurut techcrunch.com, langkah ini mencerminkan arah industri teknologi secara keseluruhan menuju masa depan di mana layar menjadi latar belakang dan audio menjadi pusat perhatian. Speaker pintar telah menjadikan asisten suara sebagai bagian tak terpisahkan di lebih dari sepertiga rumah tangga di Amerika Serikat. Meta baru saja meluncurkan fitur untuk kacamata pintar Ray-Ban-nya yang menggunakan array lima mikrofon untuk membantu Anda mendengarkan percakapan di ruangan berisik, pada dasarnya mengubah wajah Anda menjadi perangkat pendengaran arah. Google, sementara itu, mulai bereksperimen pada Juni dengan Audio Overviews yang mengubah hasil pencarian menjadi ringkasan percakapan, dan Tesla mengintegrasikan chatbot Grok dari xAI ke dalam kendaraannya untuk menciptakan asisten suara percakapan yang menangani segala hal mulai dari navigasi hingga pengaturan iklim melalui percakapan alami.
Bukan hanya raksasa teknologi yang bertaruh pada hal ini. Sejumlah startup dengan latar belakang beragam juga muncul dengan keyakinan yang sama, meskipun dengan tingkat kesuksesan yang bervariasi. Pembuat Humane AI Pin menghabiskan ratusan juta dolar sebelum perangkat wearable tanpa layar mereka menjadi peringatan bagi industri. Kalung Friend AI, yang mengklaim dapat merekam kehidupan Anda dan memberikan teman, telah memicu kekhawatiran privasi dan ketakutan eksistensial dalam proporsi yang sama. Dan kini setidaknya dua perusahaan, termasuk Sandbar dan satu yang dipimpin oleh pendiri Pebble Eric Migicovsky, sedang mengembangkan cincin AI yang diharapkan diluncurkan pada 2026, memungkinkan pemakainya untuk benar-benar berbicara dengan tangan.
Bentuk fisiknya mungkin berbeda, tetapi tesisnya sama: audio adalah antarmuka masa depan. Setiap ruang di rumah Anda, mobil Anda, bahkan wajah Anda, sedang menjadi permukaan kontrol.
Model audio baru OpenAI, yang direncanakan akan diluncurkan pada awal 2026, dilaporkan akan terdengar lebih alami, menangani gangguan seperti mitra percakapan yang sebenarnya, dan bahkan berbicara saat Anda sedang berbicara, sesuatu yang tidak dapat dilakukan oleh model saat ini. Perusahaan tersebut juga dilaporkan membayangkan keluarga perangkat, mungkin termasuk kacamata atau speaker pintar tanpa layar, yang bertindak lebih seperti teman daripada alat.
Tidak ada yang terlalu mengejutkan dari hal ini. Seperti yang dicatat oleh The Information, Jony Ive, mantan kepala desain Apple yang bergabung dengan upaya hardware OpenAI melalui akuisisi senilai $6,5 miliar atas perusahaannya, io, pada bulan Mei, telah menjadikan pengurangan ketergantungan pada perangkat sebagai prioritas. Ia melihat desain berorientasi audio sebagai kesempatan untuk memperbaiki kesalahan dari perangkat konsumen masa lalu.
