Elon Musk, CEO Tesla, bersama para ahli kecerdasan buatan (AI) lainnya, mengungkapkan bahwa data dunia nyata yang masih tersedia untuk melatih model AI kini semakin terbatas.
Musk menyebut bahwa “data puncak” yang dapat dikuasai AI akan segera tercapai. Dalam siaran langsung terbaru, ia menjelaskan bahwa hampir seluruh pengetahuan manusia yang tersedia sudah digunakan dalam pelatihan AI.
“Pada dasarnya, kami telah menghabiskan jumlah kumulatif pengetahuan manusia … dalam pelatihan AI,” kata Musk selama siaran langsung di media sosial X, seperti dilansir TRT World,
“Itu terjadi pada dasarnya tahun lalu,” tambahnya.
Musk, yang mendirikan perusahaan AI-nya sendiri, xAI, pada tahun 2023, menyarankan bahwa perusahaan teknologi kini harus beralih ke data “sintetis” — data yang dihasilkan oleh AI itu sendiri untuk mendukung pembelajaran mandiri.
“Satu-satunya cara untuk melengkapinya adalah dengan data sintetis, yang mana, data tersebut akan menulis esai atau membuat tesis, lalu akan menilai dirinya sendiri dan, menjalani proses belajar mandiri ini,” jelas pemilik media sosial X (dulu Twitter) ini.
Musk memberikan peringatan bahwa model AI cenderung menghasilkan “halusinasi” berupa keluaran yang tidak akurat atau tidak masuk akal, sehingga dapat menimbulkan risiko dalam penggunaan data sintetis.
Ia mengatakan halusinasi membuat penggunaan materi buatan menjadi “menantang”. “Sebab bagaimana Anda tahu apakah itu … jawaban yang dihalusinasikan atau jawaban yang sebenarnya,” ucapnya.
Andrew Duncan, Direktur AI Dasar di Alan Turing Institute Inggris, mencatat bahwa pernyataan Musk sejalan dengan sebuah makalah akademis terbaru yang menyebutkan bahwa data yang tersedia untuk publik untuk melatih model AI bisa habis pada tahun 2026, seperti yang dilaporkan oleh Guardian.
Ia memperingatkan bahwa ketergantungan yang berlebihan pada data sintetis dapat menyebabkan “keruntuhan model,” di mana kualitas keluaran model akan menurun.
“Saat Anda mulai memberi model materi sintetis, Anda mulai mendapatkan hasil yang semakin berkurang,” katanya, sambil menyoroti risiko keluaran yang bias dan tidak kreatif.
Duncan juga mengungkapkan bahwa peningkatan konten yang dihasilkan oleh AI di internet dapat menyebabkan materi tersebut masuk ke dalam data pelatihan untuk AI.