October 6, 2022

Open AI, pengembang generator teks-ke-gambar AI DALL-E 2, baru saja mengumumkan fitur baru untuk aplikasi yang disebut “outpainting”. Ini memungkinkan pengguna untuk memperluas gambar dan karya seni yang ada dengan konten yang dihasilkan AI. Ini cukup menarik, dan sangat memperluas kemampuan alat ini.

DALL-E 2 adalah salah satu generator teks-ke-gambar paling populer yang tersedia saat ini. Dengan lebih dari satu juta pengguna, tidak heran jika konten yang dibuat olehnya tampaknya ada di mana-mana. (Banyak generator teks-ke-gambar lainnya dalam versi beta tertutup, seperti Difusi Stabil, tidak tersedia untuk umum, seperti Google’s Imagen, atau cakupannya jauh lebih terbatas, seperti Craiyon.)

DALL-E 2 mengambil prompt teks, seperti “seorang astronot menunggang kuda dengan gaya Andy Warhol,” dan menghasilkan sembilan gambar 1.024-piksel kali 1.024-piksel yang mengilustrasikannya. Ini menggunakan proses yang disebut “difusi” di mana itu dimulai dengan kebisingan yang dihasilkan secara acak dan kemudian mengeditnya agar sesuai dengan fitur yang menonjol dari prompt sedekat mungkin.

Hingga saat ini, pengguna dibatasi dengan ukuran dan rasio aspek dari apa yang dapat mereka buat dengan DALL-E 2. Program AI hanya dapat menghasilkan kotak 1.024 piksel kali 1.024 piksel—apa pun yang lebih besar atau bentuk yang berbeda tidak mungkin. Dimungkinkan untuk menggunakan fitur yang disebut “inpainting” untuk memodifikasi detail dalam karya seni yang ada, tetapi untuk benar-benar membuat kanvas yang lebih besar yang melibatkan menjahit bagian yang berbeda secara manual menggunakan aplikasi seperti Photoshop. (Untuk rasio aspek yang berbeda, Anda dapat memotong gambar Anda, tetapi itu mengurangi resolusi keseluruhan.)

Sekarang dengan outpainting, satu-satunya batasan yang dihadapi pengguna—selain filter konten—adalah jumlah kredit yang mereka miliki. (Setiap orang mendapat 50 kredit generasi gratis selama bulan pertama dan 15 untuk digunakan setiap bulan setelah itu. Blok 115 kredit tambahan dapat dibeli seharga $15.) Menghasilkan gambar awal membutuhkan satu kredit, seperti halnya setiap bagian tambahan yang dicat.

See also  Melatih robot cara tertawa itu sulit

Outpainting berfungsi sebagai ekstensi untuk DALL-E 2. Pengguna memilih area persegi 1.024 piksel kali 1.024 piksel tempat mereka ingin memperluas gambar dan dapat menentukan petunjuk tambahan apa pun untuk memandu AI. Misalnya, untuk menambahkan lebih banyak latar belakang ke astronot di atas kuda, Anda dapat mengubah perintah menjadi “astronot menunggang kuda di bulan dengan bintang-bintang di latar belakang dengan gaya Andy Warhol.”

Untuk setiap bagian yang dicat, DALL-E 2 akan menawarkan empat kemungkinan bagi pengguna untuk memilih. Jika tidak ada yang berfungsi untuk gambar, Anda bisa mencobanya lagi.

Yang paling mengesankan, outpainting “memperhitungkan elemen visual yang ada pada gambar—termasuk bayangan, pantulan, dan tekstur.” Ini berarti bahwa detail apa pun yang ditambahkan “mempertahankan konteks” gambar dan benar-benar dapat terlihat seperti bagian dari keseluruhan yang koheren.

Dalam pengumuman outpainting DALL-E 2, ada tampilan timelapse Gadis dengan Anting Mutiara oleh Johannes Vermeer yang diperluas menjadi sekitar 20 kali ukuran aslinya. Alih-alih potret sederhana, itu menunjukkan seorang wanita muda berdiri di sebuah rumah yang berantakan. Sangat menarik untuk dilihat karena selama Anda tidak melihat terlalu dekat, itu benar-benar terlihat seperti perpanjangan dari lukisan aslinya. Gaya dan suasana keseluruhan sangat tepat. Ini hampir seperti sebuah imajiner di belakang layar ditembak.

Jika Anda ingin mencoba outpainting, Anda harus mendaftar ke DALL-E 2. Open AI saat ini mengoperasikan daftar tunggu bergulir. Jika Anda ingin mendaftar, Anda dapat melakukannya di sini.