Informasi Terpercaya Masa Kini

Meta Rilis Model AI Llama Versi Ringan, Bisa Dipakai di Smartphone

0 3

KOMPAS.com – Meta merilis model bahasa besar (Large Language Model/LLM) Llama 3.2 1B dan 3B versi ringan atau “quantized” (terkuantisasi).

Llama 3.2 1B dan 3B sebelumnya sudah diumumkan dalam acara Meta Connect yang digelar September 2024 lalu. Model kecerdasan buatan (AI) ini merupakan LLM paling kecil di antara LLM bikinan Meta lainnya, karena ditujukan agar bisa berjalan di perangkat berdaya rendah seperti perangkat seluler macam smartphone.

Llama 3.2 1B dan 3B terkuantitasi yang rilis kali ini merupakan versi ringan dari dari LLM tersebut. Untuk diketahui, kuantisasi merupakan teknik yang bisa diterapkan untuk mengurangi ukuran model AI dengan memodifikasi bobot presisi (indikator seberapa bagus model memprediksi sesuatu) model.

Menurut Meta, Llama 3.2 1B dan 3B terkuantitasi, menggunakan memori yang lebih rendah saat menjalankan program dan inferensi yang cepat. Meski lebih rendah, akurasinya tetap sama seperti Llama 3.2 1B dan 3B biasa karena Meta menggunakan dua metode kuantisasi, yaitu QLoRA dan SpinQuant.

Baca juga: Meta Rilis Fitur Keamanan untuk Lindungi Remaja dari Pemerasan Seksual

Hasil pengujian internal yang dilakukan Meta menunjukkan bahwa ukuran Llama 3.2 1B dan 3B terkuantitasi, kurang lebih 56 persen lebih ringan dibanding model aslinya. Pemrosesan inferensinya (pengambilan kesimpulan) juga 2-4 kali lipat lebih cepat.

Induk Facebook itu juga menguji model AI terkuantisasi ini pada smartphone Android OnePlus 12, dan menemukan bahwa penggunaan sumber daya memori berkurang sebesar 41 persen. Padahal kinerjanya hampir setara dengan model AI versi asli.

Agar lebih optimal lagi di perangkat mobile, Meta mengembangkan model AI versi ringan ini bersama perusahaan semikonduktor Qualcomm serta MediaTek. Meta juga memakai kernel AI Kleidi guna memaksimalkan model AI versi ringannya di CPU mobile.

Dengan memungkinkan model Llama bisa berjalan di CPU mobile, pengembang nantinya dapat menciptakan pengalaman AI yang lebih unik disertai privasi yang lebih baik. Dan yang paling penting, semua prosesnya berlangsung di perangkat, dihimpun KompasTekno dari SiliconAngle, Sabtu (26/10/2024).

Llama 3.2 1B dan 3B terkuantitasi sudah tersedia dapat diunduh dari situs Llama serta Huging Face, atau bisa diakses melalui tautan berikut ini.

Jadi pesaing GPT-4o Mini

Model AI Llama 3.2 dirilis Meta dalam acara Meta Connect, Rabu (25/9/2024). Model AI ini ini hadir sebagai pesaing GPT-4o Mini milik OpenAI yang baru dirilis Juli lalu.

Menurut CEO Meta Mark Zuckerberg, model AI ini sejauh ini telah mencapai pertumbuhan 10 kali lipat sejak 2023, bahkan kini diklaim menyamai GPT-4o Mini dalam pengenalan gambar dan tugas pemahaman visual lainnya.

Baca juga: Meta Umumkan Movie Gen, AI untuk Bikin Video dan Audio dari Teks

Sementara itu, Llama 3.2 diklaim mengungguli model AI open-source milik Google (Gemma) dan Microsoft (Phi 3.5-mini) dalam bidang-bidang seperti mengikuti instruksi, meringkas, penggunaan alat, dan penulisan ulang perintah.

“Llama terus meningkat dengan cepat, Ini memungkinkan semakin banyak kemampuan,” kata Zuckerberg.

“Llama 3.2 adalah model multimodal sumber terbuka pertama kami. Model ini akan memungkinkan banyak aplikasi yang memerlukan pemahaman visual,” kata CEO Meta Mark Zuckerberg dalam pidato pembukaannya di acara Meta Connect, Rabu.

Seperti Llama 3.1, Llama 3.2 juga diposisikan sebagai model bahasa besar bersumber terbuka alias open-source. Jadi, pengembang bisa menggunakan model AI ini dengan bebas dan gratis.

Llama 3.2 mencakup model berukuran kecil dengan 11 miliar (11 Billion/11B) parameter dan versi sedang dengan 90 miliar parameter. Model ini juga mencakup ukuran yang lebih kecil yaitu 1B alias satu miliar dan 3B  (3 billion/3B).

Model dengan parameter lebih tinggi biasanya menunjukkan bahwa model akan lebih akurat dan dapat menangani tugas yang lebih kompleks.

Seperti pendahulunya, Llama 3.2 memiliki panjang konteks 128.000 token, yang berarti pengguna dapat memasukkan banyak teks (setara ratusan halaman buku teks).

Karena memahami gambar, Llama 3.2 dengan parameter 11B dan 90B memiliki kemampuan untuk memahami bagan dan grafik, memberi keterangan pada gambar, dan menentukan obyek dari deskripsi bahasa alami.

Misalnya, pengguna dapat bertanya pada bulan apa perusahaan mereka mengalami penjualan terbaik, dan model akan memberikan alasan berdasarkan grafik yang tersedia. Model dengan parameter yang lebih besar juga dapat mengekstrak detail dari gambar untuk membuat teks.

Model yang lebih kecil ini dirancang untuk bekerja pada Qualcomm, MediaTek, dan perangkat keras Arm lainnya, dengan Meta jelas berharap untuk melihatnya digunakan pada perangkat seluler.

Leave a comment