Kami kehabisan kata-kata.
Yang asli. Ditulis oleh manusia sungguhan. Jangka waktunya lebih ketat dari yang kita perkirakan, beberapa ahli mengatakan hal ini akan berakhir pada akhir tahun ini. Apa yang terjadi selanjutnya adalah kekacauan yang disebut model runtuh. Mesin memakan ekornya sendiri, mensintesis data baru dari sampah lama, dan kemudian mulai berbohong. Bukan hanya jawaban yang salah. Fabrikasi total.
Itu tidak hanya mengganggu chatbot.
Jika LLM yang beroperasi di rumah sakit mulai salah mendiagnosis kanker karena data pelatihannya melemah, Anda menghadapi ancaman nyata. Yasser Roudi dari King’s College London mengatakan risikonya sangat besar.
“Jika saat melatih model lain mereka mengalami model Runtuh, mesin ini dapat salah mendiagnosis orang.”
Dia tidak mengatakan bisa sepertinya itu mungkin.
Jadi bagaimana kita menghentikan hal yang tidak masuk akal? Jawabannya ternyata sangat sederhana. Cukup tambahkan satu titik data manusia.
Bukan satu miliar. Satu.
Geser ke omong kosong
Kami sudah melihat tanda-tanda kecil. ChatGPT memberikan jawaban yang lembut dan halus. Halusinasi. Fakta yang terdengar benar tetapi sebenarnya tidak. Ketika LLM melatih data yang dibuat oleh LLM lain, semuanya menjadi homogen. Tepian yang aneh menghilang. Variansnya dimakan hidup-hidup.
Keruntuhan awal tampak seperti teks umum yang membosankan. Tahap akhir adalah omong kosong.
Tidak ada seorang pun yang menginginkan model yang menganggap matahari terbit di barat hanya untuk memenuhi batas tertentu. Namun melacak hal ini dalam sistem yang masif seperti menemukan jarum di tumpukan jerami digital. Itu terlalu besar. Terlalu kacau.
Model kecil, kebenaran besar
Para peneliti—tim dari King’s College London, Universitas Sains & Teknologi Norwegia, dan Abdus Salam Centre di Italia—mengambil langkah mundur. Mereka tidak melihat monster itu. Mereka melihat keluarga eksponensial. Model probabilitas yang lebih kecil.
Pikirkan lemparan koin. Kurva lonceng.
Matematika yang benar-benar bisa Anda pegang.
Dengan mempelajari model-model penurut ini, mereka menemukan mekanisme di balik pembusukan. Pertanyaan “mengapa”. Dan mereka menemukan obatnya. Tidak peduli berapa banyak slop sintetis yang ada dalam loop pelatihan, meskipun 99,9% adalah buatan mesin, sistem akan tetap sehat selama ada satu jangkar ke kebenaran dasar.
Gambar nyata yang diklasifikasikan berdasarkan manusia nyata.
Hanya satu.
Titik data eksternal ini bertindak sebagai sumur gravitasi bagi kenyataan. Ini menarik distribusi kembali ke tempat kebenaran berada. Para peneliti menerbitkannya di Physical Review Letters pada bulan Mei, membuktikan teori tersebut secara matematis.
Langkah selanjutnya?
Penerapan di dunia nyata adalah cerita lain. Kami belum pernah melihat AI besar menjadi gila di depan umum. Kami kebanyakan mendapatkan puisi aneh dan kasus pengadilan palsu. Tapi matematika tidak berbohong. Penyimpangannya ada di sana.
Roudi ingin mengujinya pada binatang yang lebih besar sekarang. Yang menjalankan internet. Jika hal ini bertahan, hal ini akan mengubah segalanya bagi para insinyur AI yang membangun ChatGPT generasi berikutnya. Mereka tidak lagi membutuhkan kumpulan data manusia yang tiada habisnya. Jangkar secukupnya saja.
Ini adalah penyelamatan yang aneh.
Satu suara manusia dalam paduan gema digital sudah cukup untuk membuat lagu tersebut tetap dapat dikenali.
Berapa lama kita bisa mempertahankan thread itu?
