Informasi Terpercaya Masa Kini

Mengenal Pendiri DeepSeek, Liang Wenfeng, Sukses Bikin AI Hebat Biaya Rendah

0 7

Nama DeepSeek sedang naik daun karena ia mampu membangun infrastruktur AI large language model (LLM) dengan biaya rendah namun mendapatkan skor kecerdasan yang baik, tak seperti LLM dari AS yang menanamkan investasi besar, juga sumber daya tenaga yang besar. Di balik itu semua, ada nama Liang Wenfeng sebagai sang pendiri DeepSeek.

Liang Wenfeng mendirikan DeepSeek di Hangzhou, sebuah kota di China bagian tenggara, pada tahun 2023. Usianya kini 40 tahun itu. Dia adalah alumni Universitas Zhejiang dengan latar belakang di bidang teknik informasi dan elektronik.

Dalam membangun AI, Liang punya semangat yang sama dengan Sam Altman, CEO OpenAI. Liang bertujuan membangun artificial general intelligence (AGI), suatu bentuk AI yang dapat menyamai atau bahkan mengalahkan manusia dalam berbagai tugas.

Aplikasi DeepSeek dirilis sebagai platform open source pada awal Januari 2025, dan sejak itu ia melonjak sebagai salah satu aplikasi iPhone paling banyak diunduh di AS, melampaui ChatGPT buatan Open AI.

Aplikasi ini dibangun memanfaatkan model V3 dari DeepSeek yang biaya pembangunan dan pelatihannya memakan 6 juta dolar AS atau sekitar Rp 97 miliar selama dua bulan. Angka tersebut jauh lebih sedikit dibandingkan miliaran dolar AS yang dikeluarkan oleh para pesaingnya di AS untuk training AI.

Sejak saat itu, produk terkini DeepSeek yang disebut R1, telah dibandingkan secara positif dengan produk terbaik ChatGPT 01 OpenAI. DeepSeek mengatakan bahwa skornya hampir sama baik atau melampaui model pesaingnya dalam tugas matematika, pengetahuan umum, dan tolok ukur performa tanya-jawab.

Model R1 dan V3 milik DeepSeek, keduanya berada di peringkat 10 teratas di Chatbot Arena, sebuah platform performa AI yang diselenggarakan oleh University of California, Berkeley, di AS.

Dia sekaligus tampak lebih efisien secara infrastruktur, dengan biaya lebih rendah untuk melatih dan mengembangkan model, dan mungkin dibuat tanpa bergantung pada akselerator chip AI terkuat yang lebih sulit dibeli di China karena kontrol ekspor AS.

“Ini bisa menjadi terobosan yang benar-benar menyamakan kedudukan dan sangat bagus bagi para peneliti dan pengembang dengan sumber daya terbatas, khususnya mereka yang berasal dari belahan bumi selatan,” kata Hancheng Cao, asisten profesor sistem informasi di Emory University di Atlanta, Georgia, AS, mengutip MIT Technology Review.

Untuk membuat R1, DeepSeek harus mengerjakan ulang proses pelatihan AI-nya untuk mengurangi beban pada GPU-nya. MIT Technology Review melaporkan, jenis GPU yang dirilis Nvidia untuk pasar China kinerjanya dibatasi hingga setengah kecepatan produk teratasnya, menurut Zihan Wang, mantan karyawan DeepSeek dan mahasiswa PhD ilmu komputer saat ini di Universitas Northwestern.

Oleh karenanya, DeepSeek harus berinovasi mengutamakan efisiensi dan kolaborasi, terutama dalam pengumpulan sumber daya.

Meskipun, analis Bernstein, Stacy Rasgon, menyebut angka-angka DeepSeek sangat menyesatkan. Sampai saat ini masih ada pertanyaan besar tentang biaya sebenarnya dan proses pembuatan produk DeepSeek.

Pembangunan infrastruktur biaya rendah dari DeepSeek mungkin menggabungkan antara chip AI yang bertenaga kelas atas, dengan chip AI performa sedang, dan yang biasa saja.

Nasib Startup AI China yang Terbatas Akses Chip AI Nvidia

Para founder startup AI di China memang harus putar otak karena di negara mereka, chip AI dari Nvidia tidak beredar banyak, lantaran pemerintah AS membatasi ekspor atau penjualan chip AI ke China.

AS khawatir startup AI China bakal lebih hebat dibandingkan perusahaan AS. Di bawah tekanan tersebut, para founder startup AI China tidak diam begitu saja. Banyak mereka yang membangun infrastruktur AI di luar China demi bisa mendapatkan akses terhadap chip AI canggih buatan Nvidia. Tak menutup kemungkinan, mereka juga melatih AI di luar China.

Perusahaan DeepSeek itu sendiri diinkubasi oleh High-Flyer, sebuah dana lindung nilai yang didirikan Liang Wenfeng pada tahun 2015. Sang pendiri DeepSeek itu dikabarkan membangun fasilitas yang menyimpan chip Nvidia A100, yang sekarang dilarang diekspor ke China.

Media China 36Kr memperkirakan bahwa perusahaan High-Flyer memiliki lebih dari 10.000 unit chip AI Nvidia A100 dalam stok, tetapi Dylan Patel, pendiri konsultan penelitian AI SemiAnalysis, memperkirakan bahwa perusahaan tersebut memiliki setidaknya 50.000 unit.

Di tengah kesuksesan DeepSeek membangun produk AI dengan biaya yang murah, itu berpotensi membuat industri AI jungkir balik. Perusahaan besar harus menghitung ulang nilai investasi mereka terhadap AI yang terkenal mahal. Di sisi lain, kehadiran DeepSeek membuktikan bahwa infrastruktur low budget mereka dapat menghasilkan produk LLM yang berkualitas.

Leave a comment