Produksi Gambar dengan AI Makin Tak Terkendali, Kita Bisa Apa?
Gambar yang diproduksi dengan AI makin susah dibedakan dengan foto yang dipotret manusia. Bagaimana caranya agar kita tak mudah dikibuli oleh foto-foto imitasi?

Mengenakan pasmina warna krem dan baju rajutan putih, perempuan itu tersenyum tipis menghadap kamera. Dia sedang berada di sebuah kafe dengan jendela kaca yang memperlihatkan pemandangan jalanan kota. Beberapa mobil tampak lalu lalang di sana.
Foto itu terlihat seperti selfie dengan kamera handphone yang diambil dari jarak dekat. Kamera ponsel yang dipakai swafoto itu tampaknya memiliki sensor yang cukup baik sehingga pori-pori kulit wajah perempuan tersebut turut terlihat.
Meski terlihat seperti hasil selfie pada umumnya, foto ini banyak dibicarakan di media sosial beberapa hari terakhir. Saya pertama kali melihat foto itu dari sebuah grup WhatsApp yang membahas pemanfaatan kecerdasan buatan (AI). Namun, bukan hanya di grup percakapan ini saja foto itu dibicarakan.
Foto tersebut juga diposting di X pada 16 Juni 2025 dan telah dilihat jutaan kali serta mendapat banyak tanggapan. Namun, sumber foto itu bukanlah dari X. Berdasar pelacakan sederhana yang saya lakukan, foto tersebut berasal dari sebuah grup Facebook yang juga membahas tentang AI.
Di grup Facebook yang sedang naik daun itu, foto tersebut diunggah pada 10 Juni lalu. Jadi, ada jeda beberapa hari sebelum foto tersebut tersirkulasi ke jaringan media sosial lain. Lalu, mengapa foto tersebut menarik banyak perhatian?
Tentu saja karena foto perempuan itu sebenarnya bukan foto yang dipotret oleh manusia. Foto itu—atau lebih tepat disebut sebagai gambar—adalah hasil kreasi AI. Di grup Facebook yang saya sebut tadi, si pengunggah menyertakan prompt untuk menghasilkan gambar super realis tersebut. Di kolom komentar, dia juga menyebut gambar itu dihasilkan menggunakan Gemini, platform AI dari Google.
Saya sudah mencoba membuat ulang gambar itu dengan prompt yang sama persis di Gemini. Tentu saja hasilnya tak sama persis dengan gambar pertama, tetapi gambar hasil pembuatan ulang itu tetap saja mengesankan karena nyaris tak bisa dibedakan dengan foto sungguhan.
Foto hasil kreasi ulang itu—seperti yang terlihat di bagian atas tulisan ini—sangat realis hingga memperlihatkan pori-pori kulit. AI juga sudah pintar membuat efek bokeh seperti yang lazim ada dalam foto hasil pemotretan sungguhan. Wajah perempuan itu juga sangat khas Indonesia dan pemandangan jalanan kota di belakangnya pun mirip dengan jalanan di kota-kota di tanah air.
Oleh karena itu, jika disebarkan tanpa informasi tambahan, kita mungkin bakal menyangka bahwa sosok perempuan di gambar tersebut sungguh ada. Melihat dari penampilannya, mungkin kita akan mengira dia adalah mahasiswi sebuah kampus ternama yang tengah mengerjakan tugas di kafe di Bandung atau Yogyakarta.
Pada gambar-gambar yang diproduksi dengan Gemini, di bagian kanan bawah memang terdapat watermark bertuliskan “ai” sebagai penanda bahwa gambar itu dibuat dengan bantuan akal imitasi. Nama file saat gambar itu diunduh pun juga menunjukkan bahwa gambar tersebut adalah hasil buatan Gemini. Namun, watermark itu bisa dengan mudah di-crop atau dihilangkan, sedangkan nama file tentu saja dengan mudah diganti.
Di foto pertama yang beredar luas, penanda lain bahwa gambar itu buatan AI adalah keberadaan orang dengan tampilan aneh di latar belakang. Sosok yang terlihat blur itu seperti sedang naik sepeda, tetapi kepalanya tampak tak utuh. Namun, di foto hasil kreasi ulang yang saya coba buat, sosok itu tidak lagi ada sehingga kian sulit mencari tanda-tanda yang menunjukkan gambar tersebut adalah buatan AI.
Era Baru
Pada Maret lalu, OpenAI merilis pembaruan yang signifikan terkait image generation atau pembuatan gambar dengan AI. Waktu itu, OpenAI menyatakan telah membangun kemampuan pembuatan gambar canggih yang dintegrasikan ke GPT-4o, salah satu model AI yang dikembangkan perusahaan asal Amerika Serikat itu.
Kemampuan image generation itu kemudian menimbulkan kehebohan di jagat maya karena gambar yang dihasilkan oleh GPT-4o mengalami peningkatan kualitas yang signifikan dibanding model-model AI sebelumnya.
Dalam sebuah tulisan di Kompas.id, saya menyebut kemampuan image generation dari GPT-4o itu merupakan era baru dalam pembuatan gambar dengan AI. Meski pembuatan gambar dengan AI sudah dikenal sejak beberapa tahun lalu, gambar-gambar yang dihasilkan AI pada era itu masih dengan mudah dibedakan dengan foto hasil jepretan manusia.
Waktu itu, AI masih sering kesulitan menghasilkan gambar yang realis, kerap salah saat menghasilkan gambar detail anggota tubuh manusia seperti jari tangan, serta seringkali menghasilkan kesalahan ejaan saat diminta membuat gambar yang mengandung teks.
Namun, berbagai masalah itu mulai teratasi saat OpenAI merilis pembaruan image generation di GPT-4o. Tak heran, beberapa saat setelah pembaruan itu dirilis, orang berbondong-bondong membuat gambar di platform ChatGPT hingga menimbulkan demam gambar ala Studi Ghibli yang kemudian diikuti kontroversi.
Setelah rilis itu, Google tampaknya terus menggenjot kemampuan image generation di model AI yang dikembangkannya agar mampu berkompetisi dengan OpenAI. Hasilnya, seperti sudah kita lihat, siapapun saat ini bisa menghasilkan gambar super realis dengan bantuan Gemini.
Namun, peningkatan kemampuan produksi gambar oleh AI itu juga memunculkan kecemasan. Sebab, gambar-gambar hasil produksi AI—yang makin susah dibedakan dengan foto sungguhan—berpotensi menimbulkan misinformasi dan hoaks.
Di tengah kondisi itu, perlu upaya menguatkan literasi tentang AI agar orang-orang tak mudah dikibuli dengan foto-foto imitasi. Mereka yang kerap memproduksi gambar dengan AI juga mesti didorong untuk bertanggung jawab agar menyertakan keterangan bahwa gambar yang mereka sebarkan itu dibuat dengan AI. Tanpa itu, kecemasan terhadap dampak AI bakal makin sulit diantisipasi.