Google Gemini Kembali Bisa Buat Gambar Orang, Pakai Imagen 3

By Reza Wahyudi On Sep 2, 2024

KOMPAS.com – Google pada Februari lalu sempat menghentikan fungsi chatbot kecerdasan buatan (artificial intelligence/AI) Gemini untuk membuat (generate) gambar orang.

Sebab, chatbot ini menuai kontroversi lantaran menghasilkan gambar orang yang tidak akurat dari sudut pandang sejarah, seperti kelompok Nazi dengan ras yang beragam.

Kini, raksasa teknologi tersebut mengumumkan bahwa Google Gemini kembali bisa membuat gambar orang.

Fitur ini akan digelontorkan dalam tahap akses awal (early access) untuk pengguna layanan berbayar Gemini Advanced, Business, Enterprise pada beberapa hari ke depan.

Fitur membuat gambar orang ini baru bisa dijajal dalam bahasa Inggris saja, tetapi aksesnya dipastikan akan diperluas ke berbagai bahasa.

Kemampuan membuat gambar orang ini ditenagai oleh Imagen 3, yaitu versi terbaru dari generator text-to-image Google AI.

Baca juga: AI Google Gemini Live Meluncur, Bisa Diajak Ngobrol Lebih Luwes

Sebelumnya, Imagen 3 sudah diluncurkan secara diam-diam lewat situs eksperimen Google, AI Test Kitchen, dan kini sedang digelontorkan di Gemini untuk semua bahasa.

Meskipun Imagen 3 bisa digunakan di semua bahasa, kemampuan membuat gambar orang baru bisa dijajal untuk versi bahasa Inggris saja.

Imagen 3 sudah dilengkapi dengan perlindungan (safeguard) bawaan dan mematuhi prinsip desain produk Google.

Oleh sebab itu, generator text-to-image ini tidak mendukung pembuatan gambar yang menggambarkan individu nyata dan mudah dikenali, anak di bawah umur, atau adegan yang berdarah, penuh kekerasan, dan seksual.

Secara fitur, Imagen 3 disebut bisa membuat gambar dengan “sejumlah kata”, baik lanskap realistis, lukisan cat air, animasi tanah liat (claymation), kartun, dan masih banyak lagi.

Ini 15 Dress Pesta Terbaik yang Dapat Kamu Gunakan Dalam Berbagai Acara!

Tak Akan Gantikan Manusia, Ini Manfaat AI di Dunia Kerja

Kuasa Hukum Rizieq Shihab Angkat Bicara Soal Kekerasan di Pondok Pesantren…

Baca juga: Chatbot AI Google Gemini Di-upgrade, Jadi Lebih Cepat dan Pintar

Google mengeklaim bahwa generator ini dibekali kemampuan membuat gambar tingkat lanjut.

Imagen 3 diklaim memiliki hasil uji (benchmark) yang lebih baik dibandingkan model pembuat gambar AI lainnya, seperti DALL-E 3, Stable Diffusion 3, dan Midjourney V6.

Imagen 3 masih menggunakan alat SynthID untuk memberikan tanda air (watermark) pada gambar AI.

Watermark ini digunakan untuk menunjukkan bahwa gambar ini dibuat oleh Google Gemini, bukan foto atau karya sungguhan.

Baca juga: Mengenal Gemini AI Google yang Mirip ChatGPT dan Cara Menggunakannya

Pakar topik

Google juga akan menggelontorkan fitur Google Gems untuk pelanggan Gemini Advanced, Business, dan Enterprise dalam beberapa hari ke depan. Gems sendiri merupakan versi Gemini yang bisa dikustomisasi.

Pengguna bisa menyesuaikan Gems untuk bertindak sebagai pakar suatu topik, atau menyempurnakannya untuk mencapai tujuan tertentu. Caranya, pengguna menulis instruksi untuk Gems, memberi nama, kemudian mengobrol dengannya.

Google akan menyediakan sejumlah Gems siap pakai, seperti Brainstormer dan Learning Coach.

Brainstormer bakal membantu pengguna memikirkan ide, misalnya ide hadiah ulang tahun, membuat bisnis, dan lain sebagainya. Di sisi lain, Learning Coach adalah Gems yang bisa diajak mengobrol untuk belajar.

Seperti yang sudah disebutkan sebelumnya, pengguna juga bisa membuat Gems-nya sendiri untuk topik apa pun.

Contohnya sebagai pakar yang bisa mengulas (review) kode pemrograman bikinan pengguna, editor untuk resume kerja pengguna, atau bahkan sebagai guru bahasa Perancis.

Gems dapat dijajal di lebih dari 150 negara dengan 30 bahasa, termasuk Indonesia, sebagaimana dikutip KompasTekno dari The Verge, Senin (2/9/2024).