DeepSeek Gandeng Ribuan Chip Nvidia, Siap Tantang OpenAI di Ranah AI

Sahrul

DeepSeek membuka tabir proses pengembangan model kecerdasan buatan (AI) open source mereka yang mampu menghemat biaya secara signifikan jika dibandingkan dengan para pesaing sekelas OpenAI. Informasi ini terungkap dari laporan yang dibuat oleh pendiri DeepSeek, Liang Wenfeng, yang menyebutkan bahwa model DeepSeek-V3 dilatih menggunakan 2.048 unit GPU Nvidia H800, sebagaimana dilansir SCMP pada Senin (19/5/2025).

“DeepSeek-V3 yang dilatih menggunakan 2.048 GPU Nvidia H800 memperlihatkan bagaimana model hardware bisa mengubah tantangan ini secara efektif, membuat pelatihan dan inference dalam skala menjadi efisien,” tulis Liang dalam laporannya.

Kerjasama erat dengan High-Flyer sebagai penyandang dana DeepSeek menjadikan akuisisi GPU H800 yang didesain khusus untuk pasar China ini memungkinkan. GPU ini merupakan jawaban Nvidia atas regulasi pembatasan teknologi dari Amerika Serikat yang membatasi ekspor chip tersebut, bahkan hingga larangan total pada 2023. Dengan begitu, DeepSeek dapat mengelola pelatihan AI dengan keterbatasan perangkat keras yang biasanya menjadi kendala utama dalam pengembangan model AI besar.

Strategi pelatihan yang digunakan DeepSeek dirancang untuk menembus batasan perangkat keras dan biaya tinggi, sebuah tantangan besar yang juga dihadapi OpenAI saat mengembangkan model GPT mereka. Selain itu, DeepSeek menambahkan berbagai teknik optimasi, seperti peningkatan efisiensi memori, penyempurnaan komunikasi antar-chip, serta penguatan performa infrastruktur AI secara menyeluruh. Pendekatan ini memungkinkan penurunan drastis biaya komputasi selama tahap pra-pelatihan dan mempercepat proses inferensi.

Metode revolusioner ini tak hanya dipakai oleh DeepSeek, melainkan juga telah diadopsi oleh sejumlah pengembang AI terkemuka di China, termasuk Alibaba dengan model AI Qwen3 mereka.

Model DeepSeek-V3 yang dirilis pada Desember 2024 dan disusul model R1 pada Januari 2025, sempat mengejutkan dunia teknologi karena membutuhkan sumber daya komputasi yang jauh lebih hemat namun tetap menyuguhkan kemampuan setara dengan GPT dari OpenAI. Meski demikian, DeepSeek memilih menjaga sikap tertutup terkait rencana penelitian jangka panjangnya dan hanya secara berkala membagikan hasil risetnya kepada publik.

Sementara itu, perusahaan-perusahaan teknologi raksasa China terus berlomba mempercepat inovasi di ranah AI. Dalam kurun enam bulan sejak peluncuran DeepSeek V3, beberapa raksasa teknologi negeri tirai bambu itu sudah menghadirkan model-model AI terbaru yang tak kalah menjanjikan.

Baidu, contohnya, meluncurkan AI Ernie 4.5 Turbo dan X1 Turbo pada April lalu yang memiliki kemampuan multimodal reasoning dengan harga 40% lebih murah dibanding DeepSeek V3. Pada waktu yang sama, Alibaba memperkenalkan model Qwen terbaru yang langsung merebut posisi DeepSeek sebagai model AI open source paling populer di dunia.

Dengan begitu, persaingan di dunia AI semakin tajam, di mana DeepSeek memanfaatkan keunggulan efisiensi biaya dan teknologi hardware khusus, sementara para pesaingnya mengusung model-model yang semakin mutakhir dan terjangkau. Pertarungan ini bagaikan perlombaan kuda dengan masing-masing joki menunggangi kuda tercepat dan terkuat, berusaha menggapai garis finish inovasi dan supremasi teknologi.

Also Read

Tags

Leave a Comment