Perusahaan rintisan tersebut menambahkan, varian pembaruannya dibuat mengambil penalaran yang digunakan model R1-0528, untuk kemudian lebih menyempurnakan model Qwen 3 8B Base milik Alibaba. Hasilnya adalah kinerja yang disebut melampaui model Qwen 3 asli lebih dari 10%.
"Kami percaya rangkaian pemikiran dari DeepSeek-R1-0528 akan memiliki kepentingan yang signifikan baik untuk penelitian akademis tentang model penalaran maupun pengembangan industri yang berfokus pada model skala kecil," kata DeepSeek.
Sebagai tanggapan terhadap persaingan dari Deepseek, Gemini milik Google telah memperkenalkan tingkatan akses yang didiskon. Sementara OpenAI memangkas harga dan merilis model o3 Mini yang mengandalkan daya komputasi yang lebih sedikit.
Deepseek masih diharapkan untuk merilis R2, penerus R1. Reuters melaporkan pada Maret, mengutip sumber, rilis R2 awalnya direncanakan pada Mei. DeepSeek juga merilis peningkatan pada model bahasa besar V3 pada bulan Maret.
(Erha Aprili Ramadhoni)