September 24, 2022

Perhatian yang semakin besar diberikan pada teknologi deepfake AI dalam beberapa tahun terakhir terutama berfokus pada tipu daya visual. Pikirkan video yang secara luar biasa dapat menempatkan wajah seseorang ke tubuh orang lain, generasi seni surealis berdasarkan saran pengguna, dan etika bermasalah seputar semua kemampuan ini. Tetapi metode kunci lain untuk meyakinkan mimikri digital baru-baru ini mendapatkan pemeriksaan dan diskusi yang tepat.

Filter vokal, meski belum tentu baru, baru-baru ini mulai dianggap lebih serius berkat bantuan AI. Sayangnya, ini menimbulkan implikasi sosial yang serius, dan seperti industri video deepfake, tampaknya hanya sedikit yang dapat dilakukan regulator untuk menghentikannya.

[Related: A startup is using AI to make call centers sound more ‘American.’]

Alat AI yang muncul seperti Koe Recast dan Voice.ai dengan cepat mengasah kemampuan mereka untuk mengubah input audio menjadi suara seperti yang diinginkan oleh siapa pun jika disediakan bahan sumber yang cukup untuk dianalisis. Dalam beberapa kasus, program ini hanya membutuhkan klip antara 15 dan 30 detik untuk menghasilkan tiruan yang meyakinkan. Meskipun Koe Recast hanya dalam fase pengujian alpha pribadi, contoh sudah tersedia yang menggambarkan klip kedua singkat dari Mark Zuckerberg terdengar seperti narator bass-berat, seorang wanita, dan bahkan karakter anime bernada tinggi.

“Tujuan saya adalah membantu orang mengekspresikan diri mereka dengan cara apa pun yang membuat mereka lebih bahagia,” pencipta Koe Recast yang berbasis di Texas, Asara Near, mengatakan Ars Technica dalam wawancara minggu lalu. Near menambahkan bahwa ia bermaksud untuk akhirnya merilis aplikasi desktop yang dapat mengubah suara pengguna secara realtime pada platform seperti Discord dan Zoom. Ketika ditanya tentang potensi aktor jahat untuk menggunakan Koe Recast untuk serangan pribadi dan informasi yang salah, Near berpendapat bahwa, “Seperti halnya teknologi apa pun, mungkin ada positif dan negatifnya, tetapi saya pikir sebagian besar umat manusia terdiri dari yang luar biasa. orang dan akan mendapat manfaat besar dari ini.”

[Related: How artificial intelligence exploded over the past decade.]

Kritikus, bagaimanapun, tetap skeptis mempercayai masyarakat umum dengan alat yang berpotensi kacau seperti itu. Baru-baru ini, beberapa perwakilan call center outsourcing juga mulai menggunakan perangkat lunak AI untuk menghapus aksen negara asal mereka agar terdengar lebih “Amerika” dalam upaya mengurangi bias konsumen Barat. Sementara pencipta alat berpendapat penemuan mereka mencegah prasangka, banyak yang membantah bahwa itu hanya menyediakan sarana untuk menghindari berurusan dengan masalah yang lebih besar di tangan-yaitu, xenofobia dan rasisme.

Demikian juga, karyawan di beberapa bisnis besar telah menjadi mangsa scammer yang meminta transfer dana dan kata sandi sambil menggunakan mimikri audio serupa untuk meniru bos. “Di antara bisnis yang lebih besar, saya pikir semakin banyak dari mereka yang mulai melihat ini karena mereka benar-benar target yang matang untuk hal semacam ini,” Kyle Alspach, seorang reporter keamanan siber untuk Protokol, dijelaskan saat berbicara baru-baru ini di NPR’s pasar.

Sementara Alspach juga mencatat bahwa jenis penipuan ini masih dalam masa pertumbuhan, kemungkinan tidak akan lama sebelum taktik ini menjadi lebih umum, dan sayangnya, lebih sulit untuk membedakan fakta dari fiksi. Jadi sayangnya, tidak ada yang bisa menghentikan eskalasi cepat mimikri visual dan audio yang diaktifkan AI.

See also  'Pusat kehamilan krisis' akan hadir dengan peringatan di Yelp