September 24, 2022

Minggu ini, Meta meluncurkan model kecerdasan buatan baru, yang disebut Sphere, yang dirancang untuk memverifikasi kutipan Wikipedia secara otomatis. Basis pengetahuan Sphere berasal dari 134 juta halaman web.

Meta mengatakan bahwa pihaknya tidak bermitra dengan Wikimedia (organisasi nirlaba pemilik wikipedia.com) dalam proyek ini, yang masih dalam tahap penelitian dan tidak digunakan untuk mendorong pembaruan langsung di Wikipedia. Namun, Wikimedia diumumkan baru-baru ini bahwa ia menggunakan teknologi Meta dalam Alat Terjemahan Kontennya.

Sphere, Meta mengatakan dalam sebuah posting blog, adalah model AI yang melakukan pemrosesan bahasa alami yang intensif pengetahuan, tugas yang sama yang dilakukan asisten virtual di ponsel Anda ketika Anda mengajukan pertanyaan seperti “siapa yang memenangkan Hadiah Nobel pertama dalam fisika?” Model-model ini kemudian akan menggali melalui repositori untuk menemukan jawaban yang cocok.

Dalam kasus Sphere, ia menggunakan informasi dari web terbuka “tidak terstruktur” sebagai lawan dari mesin pencari. “Karena Sphere dapat mengakses jauh lebih banyak informasi publik daripada model standar saat ini, Sphere dapat memberikan informasi berguna yang tidak dapat mereka akses,” tulis peneliti Meta dalam posting blog. Selain itu, sistem Meta menggunakan pemahaman bahasa alami untuk “memperkirakan kemungkinan klaim dapat disimpulkan dari sumber.” Teknik ini memecah kalimat atau frase menjadi representasi matematis, dan kemudian membandingkan set representasi satu sama lain.

[Related: Meta wants to improve its AI by studying human brains]

Pracetak yang menjelaskan Sphere dapat ditemukan di arXiv, dan perangkat lunak itu sendiri bersumber terbuka di GitHub. Meta juga telah membuat tes benchmark yang disebut KILT yang akan digunakan untuk menilai kinerja Sphere dan model serupa lainnya pada berbagai tugas seperti pengecekan fakta, dialog Tanya Jawab, dan menyisipkan tautan yang relevan.

See also  Para ilmuwan sedang mengembangkan alternatif semen 'hijau'

Kemampuan ini sejauh ini hanya digunakan untuk memindai dan memeriksa kutipan Wikipedia. “Ini menarik perhatian pada kutipan yang dipertanyakan, memungkinkan editor manusia untuk mengevaluasi kasus yang paling mungkin cacat tanpa harus menyaring ribuan pernyataan yang dikutip dengan benar,” Meta menjelaskan. “Jika kutipan tampaknya tidak relevan, model kami akan menyarankan sumber yang lebih dapat diterapkan, bahkan menunjuk ke bagian spesifik yang mendukung klaim tersebut.”

[Related: ‘Adopting typos’ and other ways to edit Wikipedia]

Pada akhirnya, belajar untuk memahami hubungan antara bagian teks dalam entri Wikipedia dan tautan yang mereka kutip juga akan meningkatkan kemampuan model untuk mengurai pengetahuan dunia nyata, karena pengeditan kutipan memerlukan pemahaman yang kuat tentang pemahaman dan penalaran bahasa manusia.

“Model ini adalah komponen pertama dari editor potensial yang dapat membantu memverifikasi dokumen secara real time. Selain mengusulkan kutipan, sistem akan menyarankan teks pelengkapan otomatis – diinformasikan oleh dokumen relevan yang ditemukan di web – dan menawarkan koreksi proofreading, ”kata Meta. “Idealnya, model akan memahami banyak bahasa dan dapat memproses beberapa jenis media, termasuk video, gambar, dan tabel data.”