AI Google Gemini 2.5 Flash Image Resmi, Lebih Jago Ubah dan Bikin Gambar

AI Gemini Live dari Google Asisten, Bisa Diajak Curhat!

Google resmi merilis Gemini 2.5 Flash Image, model kecerdasan buatan (AI) terbaru yang dirancang khusus untuk membuat dan mengedit gambar.

Model ini menjadi bagian dari keluarga Gemini 2.5 Flash, tapi hadir dengan fokus pada kemampuan visual yang lebih canggih. Menurut Google, Gemini 2.5 Flash Image menawarkan kualitas gambar lebih baik, kontrol kreatif lebih presisi, serta kecepatan pemrosesan yang tetap rendah.

Read More

Kehadiran Gemini 2.5 Flash Image ini diumumkan lewat sebuah posting di blog resmi Google Developers baru-baru ini.

Menurut posting tersebut, model AI ini memungkinkan pengguna membuat gambar baru dari nol, mengedit gambar yang sudah ada, hingga menggabungkan beberapa gambar menjadi satu.

Bedanya dengan model AI lain, Gemini 2.5 Flash Image diklaim bisa menjaga konsistensi detail penting, seperti wajah, karakter, atau produk.

“Kami benar-benar meningkatkan kualitas visual, serta kemampuan model untuk mengikuti instruksi,” ujar Nicole Brichtova, pimpinan visual generation models di Google DeepMind, dalam wawancara dengan TechCrunch.

“Pembaruan ini jauh lebih baik dalam membuat pengeditan lebih lancar, dan keluaran model dapat digunakan untuk apa pun yang Anda inginkan,” kata Brichtova.

Baca juga: Adu Foto AI Buatan ChatGPT dan Google Gemini, Mana Lebih Realistis?

Beberapa fungsi utama yang ditawarkan antara lain:

1. Konsistensi karakter:

Bisa menempatkan karakter atau objek yang sama ke berbagai latar berbeda tanpa mengubah penampilan aslinya. Misalnya, tokoh kartun yang sama bisa dibuat muncul di beberapa adegan dengan ekspresi dan detail yang konsisten.

2. Edit berbasis perintah teks:

Pengguna cukup mengetik instruksi sederhana untuk mengedit gambar. Contohnya, mengganti warna baju, menghapus seseorang dari foto, menambahkan objek baru, hingga memberi warna pada foto hitam-putih.

3. Multi-image fusion:

Menggabungkan beberapa foto ke dalam satu hasil. Misalnya, sofa dari satu foto bisa dipindahkan ke ruang tamu dari foto lain dengan warna dinding sesuai palet tertentu.

4.Pengetahuan dunia nyata:

Model ini diklaim memahami konteks visual dan informasi dunia, sehingga bisa digunakan untuk hal-hal edukatif, seperti membaca diagram buatan tangan lalu menjelaskannya.

Google menekankan bahwa Gemini 2.5 Flash Image unggul dalam menjaga detail wajah dan objek yang biasanya sering terdistorsi di model lain.

Misalnya, ketika mengganti warna pakaian dalam sebuah foto, model ini tetap mempertahankan ekspresi wajah dan latar belakang agar tidak ikut berubah. Selain itu, kualitas visual yang dihasilkan disebut lebih natural dan tajam hingga 1.024 piksel.

Dalam uji coba internal, hasil Gemini 2.5 Flash Image dinilai setara atau bahkan lebih baik dibanding model populer dari pesaing, seperti OpenAI DALL-E, Midjourney, maupun FLUX buatan Black Forest Labs.

Otomatis dibubuhi watermark

Google menyadari risiko penyalahgunaan teknologi gambar AI, terutama terkait deepfake atau gambar manipulasi yang sulit dibedakan dengan foto asli.

Karena itu, semua gambar yang dihasilkan Gemini 2.5 Flash Image otomatis diberi tanda air digital tak terlihat (watermark SynthID) dan metadata khusus agar bisa diidentifikasi sebagai buatan AI.

Google juga membatasi pembuatan konten berbahaya atau eksplisit. Misalnya, pengguna dilarang membuat gambar intim tanpa izin atau konten yang meniru figur publik secara tidak pantas.

Ketersediaan

Saat ini, Gemini 2.5 Flash Image sudah mulai dirilis di beberapa platform Google yaitu :

1. Aplikasi Gemini untuk pengguna umum

2. Gemini API dan Google AI Studio untuk pengembang

3. Vertex AI

Pengguna bisa langsung mencoba membuat atau mengedit gambar dengan mengetikkan perintah teks di aplikasi Gemini. Khusus untuk akun gratisan, semua input dan output gambar dari pengguna bakal dipakai sebagai bahan belajar untuk meningkatkan kualitas produk Gemini.

Related posts