Pembelajaran AI dari AI adalah Awal dari Akhir untuk Model AI.

by Jose Antonio Lanz

Mesin AI generatif sangat rakus untuk konten, mungkin akan mengonsumsi lebih banyak materi yang dihasilkan oleh AI.

Kecerdasan Buatan telah menjadi perubahan besar dalam banyak bidang, dari perawatan kesehatan hingga ritel hingga hiburan dan seni. Namun, penelitian baru menunjukkan bahwa kita mungkin telah mencapai titik kritis: pembelajaran AI dari konten yang dihasilkan AI sendiri. Ouroboros AI ini – seekor ular yang memakan ekornya sendiri – bisa berakhir cukup buruk. Sebuah kelompok penelitian dari berbagai universitas di Inggris telah mengeluarkan peringatan tentang apa yang mereka sebut “keruntuhan model,” proses degeneratif yang bisa sepenuhnya memisahkan AI dari kenyataan.

Dalam sebuah makalah berjudul “The Curse of Recursion: Training on Generated Data Makes Models Forget,” para peneliti dari Universitas Cambridge dan Oxford, Universitas Toronto, dan Imperial College di London menjelaskan bahwa kegagalan model terjadi ketika “data yang dihasilkan akhirnya mencemari set pelatihan generasi model berikutnya.” “Dilatih dengan data yang tercemar, mereka kemudian salah mempersepsi kenyataan,” tulis mereka. Dengan kata lain, konten yang luas yang dihasilkan oleh AI yang dipublikasikan online dapat disedot kembali ke sistem AI, menyebabkan distorsi dan ketidakakuratan.

Masalah ini telah ditemukan dalam berbagai model dan alat generatif yang dipelajari, termasuk Large Language Models (LLMs), Variational Autoencoders, dan Gaussian Mixture Models. Seiring waktu, model mulai “melupakan distribusi data yang sebenarnya,” menyebabkan representasi yang tidak akurat dari kenyataan karena informasi asli menjadi begitu distorsi sehingga tidak menyerupai data dunia nyata.
Sudah ada contoh di mana model pembelajaran mesin dilatih pada data yang dihasilkan oleh AI. Misalnya, Language Learning Models (LLMs) sengaja dilatih pada output dari GPT-4. Demikian pula, DeviantArt, platform online untuk seniman, memungkinkan karya seni yang dibuat oleh AI dipublikasikan dan digunakan sebagai data pelatihan untuk model AI yang lebih baru.


Posted

in

by

Tags:

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *