Informasi Terpercaya Masa Kini

AWS Luncurkan Amazon Nova, AI “Multimodal” Pesaing Google Gemini dan GPT-4V

0 10

LAS VEGAS, KOMPAS.com – Perusahaan cloud computing, Amazon Web Service (AWS) merilis rangkaian model generative AI multimodal yang diberi nama Amazon Nova.

AI multimodal adalah model yang mampu memproses informasi dari berbagai modalitas, termasuk gambar, video, dan teks. Misalnya ketika model AI diberi sebuah gambar, AI dapat memberikan respons yang lebih akurat berdasarkan gambar tersebut.

Model AI ini diumumkan secara khusus oleh CEO Amazon, Andy Jassy di salah satu sesi acara “re:Invent 2024” yang berlangsung di Las Vegas, Selasa (3/12/2024) pagi atau sekitar Rabu dini hari waktu Indonesia.

Jurnalis KompasTekno Wahyunanda Kusuma Pertiwi hadir langsung di Las Vegas dalam acara peluncuran tersebut.

“Dengan senang hati saya mengumumkan peluncuran Amazon Nova, yaitu serangkaian pondasi model yang menawarkan kecerdasan mutakhir,” jelas Andy.

Andy menjelaskan, salah satu alasan mengapa AWS mengembangkan model generative AI sendiri adalah untuk memenuhi kebutuhan pelanggannya.

Baca juga: AWS Umumkan Chip Generative AI Trainium3

“Kami terus bekerja menggarap frontier model (model AI mutakhir) kami sendiri. Dan perkembangan frontier model itu luar biasa dalam 4-5 bulan terakhir,” kata Andy di atas panggung.

Sebagai gambaran, model generative AI multimodal seperti Amazon Nova adalah jenis model AI yang bisa menghasilkan (generate) berbagai jenis konten, mulai dari teks, gambar, audio, video, atau kombinasi dari semuanya.

Konsepnya sama seperti GPT-4V(ision) milik OpenAI atau Google Gemini.

Total, Amazon Nova memiliki empat model, yakni Mikro, Lite, Pro, dan Premier. Untuk Micro, Lite, dan Pri sudah tersedia untuk pelanggan AWS. Sementara Premier baru akan hadir pada kuartal-I tahun depan. Adapun perbedaan empat model AI di atas adalah sebagai berikut:

  • Amazon Nova Micro: Model ini khusus men-generate konten teks, menawarkan lantensi rendah dan biaya yang lebih hemat.
  • Amazon Nova Lite: Multimodal untuk memproses konten gambar, video, dan teks dengan biaya yang sangat murah.
  • Amazon Nova Pro: Multimodal tingkat tinggi dibanding dua jenis sebelumnya, menawarkan akurasi, kecepatan dan harga yang didasarkan pada kebutuhan.
  • Amazon Nova Premier: Multimodal paling tinggi di antara jenis lainnya, mampu memproses beragam jenis konten yang lebih kompleks dan bisa menjadi “guru” untuk melatih model “custom”.

Model generative AI multimodal di atas akan tersedia di AWS Bedrock, yakni platform pengembangan AI milik AWS.

Baca juga: AWS re:Invent 2024 Resmi Digelar, Umumkan Solusi Cloud Computing Baru

Pada saat yang bersamaan, Andy juga mengumumkan dua model lain. Pertama adalah Nova Canvas, yakni model art image generation, yang lebih diperuntukan untuk segmen periklanan, marketing, publikasi, dan sebagainya, yang membutuhkan materi visual berupa gambar, bukan video.

Model ini memungkinkan pelanggan AWS untuk menyunting gambar menggunakan input teks bahasa yang lebih natural (text to image).

“Model ini juga memiliki kontrol bawaan (built-in control) untuk penggunaan yang lebih bertanggungjawab, seperti watermark untuk keterterlusuran, dan moderasi konten untuk membatasi konten berbahaya,” jelas Andy.

Model kedua adalah Amazon Nova Reel, yang lebih fokus untuk menghasilkan konten video.

Dengan model ini, pelanggan AWS bisa mengendalikan kamera secara penuh, sehingga bisa mengatur gerakan, membuat efek panning, membuat video 360 derajat atau zoom.

Model ini juga dibekali kontrol bawaan sama seperti Nova Canvas. Untuk saat ini, Nova Reel masih terbatas untuk membuat video berdurasi enam detik dengan proses generate sekitar tiga detik.

Andy menjanjikan, durasi video yang lebih panjang, yakni hingga dua menit akan hadir beberapa bulan ke depan.

Semua model AI baru Amazon ini mendukung lebih dari 200 bahasa dan modalitas. AWS mengeklaim, Amazon Nova Pro leih murah 75 persen dibanding model AI multimodal sekelasnya.

Leave a comment