October 6, 2022

Salvador Dalí, seniman Spanyol yang lahir pada tahun 1904, dikenal karena lukisan surealisnya: jam yang meleleh, gajah dengan kaki setipis serangga, wajah dan anggota tubuh manusia yang terdistorsi. Dall-E (diucapkan seperti Dalí) Mini, program AI baru yang memulai debutnya pada awal Juni, dengan cepat dikenali sebagai sumber seni surealis lain, menghasilkan gambar melalui permintaan yang dibuat pengguna seperti sebotol peternakan bersaksi di pengadilan, petunjuk wikihow tentang cara memakan paludan seorang perawat dari film “Silent Hill” sedang makan pizza.

Gambar-gambarnya menghibur, dan programnya semakin menarik daya tarik online karena seninya yang lucu. Pengguna dapat mengetik dalam fase—frasa apa pun—dan kemudian melihat gambar yang dihasilkan AI yang telah mereka tulis meledak menjadi kreasi. Dall-E Mini adalah proyek sumber terbuka berdasarkan teknologi Dall-E asli dari OpenAI, laboratorium penelitian AI, yang menghasilkan gambar dan seni realistis dari teks. Sebagian besar karya seni yang dihasilkan Dall-E Mini disambut dengan tawa. Tetapi ketika teknologi seperti ini menjadi lebih halus dan digunakan secara luas, risiko penyalahgunaan meningkat—dan itu bukan bahan tertawaan.

Dall-E Mini mengikuti Dall-E 2, yang secara resmi dirilis OpenAI pada April 2022. Dall-E 2 beroperasi dengan membangun asosiasi antara miliaran gambar online dan deskripsi yang menyertainya. Dall-E Mini beroperasi dengan cara yang sama, tetapi dibuat dalam skala yang jauh lebih kecil. Proyek, yang dipimpin oleh Boris Dayma, menggunakan sekitar 15 juta gambar dari tiga set data untuk menginformasikan model mereka, dan kira-kira 27 kali lebih kecil dari program Dall-E asli OpenAI. Dall-E Mini dihosting di Hugging Face, sebuah perusahaan yang menyediakan model dan alat pembelajaran mesin dan mengatakan bahwa mereka memiliki misi untuk “mendemokratisasi pembelajaran mesin yang baik”.

See also  Logam yang paling luar biasa | Ilmu pengetahuan populer

Pengguna dapat membuat gambar apa pun yang mereka inginkan, meskipun hasilnya lebih condong ke arah lucu daripada akurat. Shuman Ghosemajumder, mantan kepala AI di perusahaan keamanan teknologi F5, mengatakan bahwa bagian dari komedi dan daya tarik berasal dari ketidaksempurnaan yang tidak terduga. “Alasan mengapa itu menyenangkan sebagian karena gambarnya tidak sempurna,” kata Ghosemajumder. “Ada gambar impresionistik, ada semacam gambar mimpi buruk, ada gambar yang terlihat gila. Semua itu menarik untuk dilihat dan menyenangkan untuk dibagikan.”

Ghosemajumder mengatakan dia dapat melihat teknologi semacam ini melalui beberapa fase berbeda di bawah mata publik. Awalnya, orang penasaran dengan kapasitas program seperti ini. Ada keajaiban dan pembelajaran saat orang mengeksplorasi kerumitan dari apa yang dapat mereka buat—seperti yang telah ditunjukkan secara online. Kemudian, dia mengatakan fase kedua lebih merupakan transisi dari hiburan murni ke orang-orang yang memahami nilai dari apa yang dapat mereka hasilkan.

“Anda dapat membuat ilustrasi dasar untuk tujuan tertentu dan Anda dapat memahami keadaan teknologi saat ini dengan lebih baik, sehingga Anda dapat mulai membuat rencana tentang bagaimana Anda ingin menggunakan versi yang lebih maju dari teknologi ini di masa depan,” kata Ghosemajumder.

Ke depan, ia membayangkan bahwa fase ketiga dari bagaimana teknologi ini dirasakan adalah bagaimana mereka meletakkan dasar untuk inovasi yang lebih maju di masa depan, seperti video sintetis berkualitas tinggi.

Tetapi seiring dengan semakin baik inovasi ini, risiko gambar berbahaya dan menyesatkan meningkat.

Saat ini, kata Ghosemajumder, gambar Dall-E Mini cukup “berkualitas rendah” sehingga pengguna biasanya tahu bahwa itu adalah hasil buatan AI dan belum tentu gambar sebenarnya yang diambil, katakanlah, sebotol peternakan yang bersaksi di pengadilan. Tetapi ketika menjadi lebih sulit untuk mengidentifikasi apakah sesuatu dibuat pada platform AI versus ditangkap di dunia non-digital, akan lebih mudah bagi orang untuk membuat gambar yang dimasukkan ke dalam kampanye informasi yang salah secara online.

See also  Cara merawat kedepan dan check in orang tersayang dari jarak jauh

“Ini bukan hanya Tupac atau Darth Vader versi impresionistik yang dapat dibuat orang,” kata Ghosemajumder. “Sebaliknya itu akan menjadi seperti, ‘wow, ini terlihat seperti orang sungguhan yang melakukan sesuatu.’ Saya bisa membuat gambar politisi melakukan sesuatu yang tidak pernah mereka lakukan, dan akhirnya membuat keseluruhan alur cerita dan menggunakannya untuk menyebarkan disinformasi.”

Untuk saat ini, Dall-E 2 belum tersedia untuk umum, sementara pengembang OpenAI bergulat dengan potensi risiko penyalahgunaan. (Dall-E Mini adalah versi sumber terbuka yang serupa tetapi diproduksi secara publik.) Demikian pula, Imagen, program teks-ke-gambar Google, belum merilis akses ke platform mereka. Dalam kedua kasus, perusahaan telah mempekerjakan peneliti dan seniman untuk menguji program dan meningkatkan operasi dan data pelatihan, memastikan keamanan, dan membuat seni lebih baik. Memiliki rilis terbatas sebelum rilis umum adalah “prinsip perangkat lunak yang diterima secara luas,” kata Ghosemajumder, yang menurutnya akan semakin penting karena teknologi menjadi lebih kompleks.

Pada akhirnya, salah satu kekuatan terbesar yang ditawarkan teknologi seperti Dall-E Mini adalah bahwa mereka akan memungkinkan lebih banyak orang untuk memvisualisasikan berbagai hal dengan lebih mudah daripada yang bisa mereka lakukan sekarang, kata Ghosemajumder. Dia melihatnya sebagai demokratisasi konten berkualitas tinggi.

“Ini membuka kreativitas orang dan memungkinkan orang untuk berkomunikasi lebih efektif,” kata Ghosemajumder. “Ini berpotensi membuat orang jauh lebih efisien dan efektif dalam menghasilkan ilustrasi dan foto dari berbagai konsep yang ingin mereka visualisasikan.”

Adapun Ghosemajumder, kreasi Dall-E Mini-nya adalah serangkaian gambar yang menggambarkan bagaimana Chewbacca menjalani harinya—jika dia memiliki pekerjaan kantor.