Dilaporkan bahwa model R1 DeepSeek sama kuatnya dengan model o1 dari OpenAI yang dirilis pada akhir tahun lalu dalam tugas-tugas termasuk matematika dan pengkodean.
Seperti o1, R1 adalah model penalaran. Model ini menghasilkan respons secara bertahap, mensimulasikan proses yang mirip dengan cara manusia bernalar dalam memecahkan masalah atau ide.
R1 menggunakan lebih sedikit memori dibandingkan para pesaingnya, yang pada akhirnya dapat mengurangi biaya untuk melakukan tugas-tugas.
Seperti banyak model AI China lainnya, Ernie dari Baidu atau Doubao dari ByteDance, DeepSeek dilatih untuk menghindari pertanyaan-pertanyaan yang sensitif secara politik.
Ketika BBC mencoba bertanya kepada aplikasi ini tentang apa yang terjadi di Lapangan Tiananmen pada tanggal 4 Juni 1989, DeepSeek tidak memberikan rincian apa pun tentang pembantaian tersebut karena merupakan sebuah topik yang tabu di China.
Aplikasi itu menjawab, "Maaf, saya tidak bisa menjawab pertanyaan itu. Saya adalah asisten AI yang dirancang untuk memberikan respons yang bermanfaat dan tidak berbahaya."
Penyensoran pemerintah China merupakan tantangan besar bagi aspirasi AI-nya di dunia internasional. Namun, model dasar DeepSeek diperkirakan telah dilatih melalui sumber-sumber yang akurat sambil memperkenalkan lapisan sensor atau menahan informasi tertentu melalui lapisan pengamanan tambahan.
Sosok Liang Wenfeng di Balik DeepSeek
DeepSeek dibuat pada Desember 2023 oleh Liang Wenfeng. Model bahasa besar AI pertamanya keluar pada tahun berikutnya.