Meta Rilis Model AI Llama Versi Ringan, Bisa Dipakai di Smartphone

By Reska K. Nistanto On Oct 26, 2024

KOMPAS.com – Meta merilis model bahasa besar (Large Language Model/LLM) Llama 3.2 1B dan 3B versi ringan atau “quantized” (terkuantisasi).

Llama 3.2 1B dan 3B sebelumnya sudah diumumkan dalam acara Meta Connect yang digelar September 2024 lalu. Model kecerdasan buatan (AI) ini merupakan LLM paling kecil di antara LLM bikinan Meta lainnya, karena ditujukan agar bisa berjalan di perangkat berdaya rendah seperti perangkat seluler macam smartphone.

Llama 3.2 1B dan 3B terkuantitasi yang rilis kali ini merupakan versi ringan dari dari LLM tersebut. Untuk diketahui, kuantisasi merupakan teknik yang bisa diterapkan untuk mengurangi ukuran model AI dengan memodifikasi bobot presisi (indikator seberapa bagus model memprediksi sesuatu) model.

Menurut Meta, Llama 3.2 1B dan 3B terkuantitasi, menggunakan memori yang lebih rendah saat menjalankan program dan inferensi yang cepat. Meski lebih rendah, akurasinya tetap sama seperti Llama 3.2 1B dan 3B biasa karena Meta menggunakan dua metode kuantisasi, yaitu QLoRA dan SpinQuant.

Baca juga: Meta Rilis Fitur Keamanan untuk Lindungi Remaja dari Pemerasan Seksual

Hasil pengujian internal yang dilakukan Meta menunjukkan bahwa ukuran Llama 3.2 1B dan 3B terkuantitasi, kurang lebih 56 persen lebih ringan dibanding model aslinya. Pemrosesan inferensinya (pengambilan kesimpulan) juga 2-4 kali lipat lebih cepat.

Induk Facebook itu juga menguji model AI terkuantisasi ini pada smartphone Android OnePlus 12, dan menemukan bahwa penggunaan sumber daya memori berkurang sebesar 41 persen. Padahal kinerjanya hampir setara dengan model AI versi asli.

Agar lebih optimal lagi di perangkat mobile, Meta mengembangkan model AI versi ringan ini bersama perusahaan semikonduktor Qualcomm serta MediaTek. Meta juga memakai kernel AI Kleidi guna memaksimalkan model AI versi ringannya di CPU mobile.

Dengan memungkinkan model Llama bisa berjalan di CPU mobile, pengembang nantinya dapat menciptakan pengalaman AI yang lebih unik disertai privasi yang lebih baik. Dan yang paling penting, semua prosesnya berlangsung di perangkat, dihimpun KompasTekno dari SiliconAngle, Sabtu (26/10/2024).

Llama 3.2 1B dan 3B terkuantitasi sudah tersedia dapat diunduh dari situs Llama serta Huging Face, atau bisa diakses melalui tautan berikut ini.

Jadi pesaing GPT-4o Mini