Mengenal DeepSeek-R1
Baru-baru ini, DeepSeek, sebuah perusahaan riset AI asal China, meluncurkan model AI reasoning terbaru bernama DeepSeek-R1. Model ini digadang-gadang mampu bersaing dengan salah satu model AI reasoning terdepan, OpenAI o1. Dalam pratinjau yang dirilis, DeepSeek-R1 menunjukkan kemampuan unik untuk “berpikir” melalui suatu masalah secara mendalam sebelum memberikan jawaban.
Tidak seperti model AI konvensional, model reasoning seperti DeepSeek-R1 dirancang untuk secara efektif memeriksa ulang (fact-check) jawaban yang dihasilkannya. Dengan mengambil waktu lebih lama untuk memproses sebuah pertanyaan, model ini dapat mengurangi kesalahan umum yang sering terjadi pada AI.
Keunggulan dan Keterbatasan DeepSeek-R1
DeepSeek mengklaim bahwa DeepSeek-R1 mampu bersaing dengan OpenAI o1-preview pada dua tolok ukur AI populer:
- AIME – Evaluasi oleh model AI lain terhadap kinerja DeepSeek-R1.
- MATH – Pengujian berupa kumpulan soal berbasis teks.
Namun, DeepSeek-R1 masih memiliki beberapa kelemahan. Beberapa pengguna mencatat bahwa model ini mengalami kesulitan dalam permainan logika sederhana seperti tic-tac-toe, tantangan yang juga dialami oleh OpenAI o1. Selain itu, model ini rentan terhadap teknik “jailbreak,” di mana pengguna dapat memanipulasi model untuk mengabaikan batasan keamanan, seperti memberikan resep zat ilegal.
Yang menarik, DeepSeek-R1 juga membatasi jawabannya pada topik-topik sensitif seperti pemimpin Tiongkok Xi Jinping atau insiden Lapangan Tiananmen. Hal ini kemungkinan besar mencerminkan pengaruh regulasi pemerintah China, yang mewajibkan proyek AI mencerminkan “nilai-nilai inti sosialisme.”
Pendekatan Baru dalam Dunia AI
DeepSeek-R1 menggunakan pendekatan yang disebut test-time compute atau inference compute, yang memungkinkan model untuk memproses informasi lebih lama saat menjawab pertanyaan kompleks. Pendekatan ini menandai pergeseran paradigma dalam pengembangan AI. Dengan melampaui pendekatan tradisional yang mengandalkan peningkatan data dan daya komputasi semata, model reasoning seperti DeepSeek-R1 dan OpenAI o1 menghadirkan potensi baru dalam pengembangan kecerdasan buatan.
Microsoft CEO Satya Nadella bahkan menyebut fenomena ini sebagai “kemunculan hukum skala baru,” menyoroti pentingnya test-time compute dalam meningkatkan kemampuan AI modern.
Peran DeepSeek dalam Industri AI
DeepSeek bukanlah pemain baru. Model awal mereka, DeepSeek-V2, pernah memaksa kompetitor seperti ByteDance, Baidu, dan Alibaba untuk menurunkan harga penggunaan model mereka. Bahkan, beberapa layanan AI mereka dijadikan gratis sebagai respons terhadap persaingan ketat ini.
Didukung oleh High-Flyer Capital Management, sebuah hedge fund yang menggunakan AI untuk perdagangan kuantitatif, DeepSeek memiliki ambisi besar. Mereka berinvestasi besar-besaran dalam infrastruktur, termasuk kluster server dengan 10.000 GPU Nvidia A100 yang menghabiskan biaya sekitar 138 juta dolar.
Kesimpulan
DeepSeek-R1 menjadi salah satu bukti kemajuan pesat AI reasoning di dunia. Dengan rencana untuk membuka akses API dan open-source model ini, DeepSeek-R1 memiliki potensi untuk mendefinisikan ulang lanskap AI global. Meski belum sempurna, model ini menunjukkan bahwa kita berada di era baru kecerdasan buatan, di mana kemampuan untuk “berpikir” lebih penting daripada sekadar memproses data.