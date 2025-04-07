Makin Cerdas dan Mirip Manusia. Chatbot AI Kini Telah Berhasil Lulus Tes Turing

JAKARTA - Chatbot kecerdasan buatan (AI) seperti ChatGPT yang telah dirancang untuk meniru ucapan manusia membuatnya semakin sulit untuk dibedakan dengan pengguna asli. Dan kini, ilmuwan telah mengungkapkan bahwa dua chatbot populer telah berhasil lulus dari tes Turing.

Dirancang oleh pemecah kode Perang Dunia II asal Inggris Alan Turing pada 1950, tes Turing atau 'permainan imitasi' adalah ukuran standar untuk menguji kecerdasan dalam sebuah mesin. AI lulus uji ketika manusia tidak dapat membedakan dengan benar antara respons dari manusia lain dan respons dari AI.

Lulus dengan Skor Tinggi

Para ilmuwan di University of California San Diego (UCSD) kini telah mengungkapkan bahwa ChatGPT milik OpenAI, maupun LlaMa dari Meta, telah lulus tes Turing.

“Hasilnya merupakan bukti empiris pertama bahwa sistem buatan apa pun lulus uji Turing tiga pihak standar,” kata para ilmuwan UCSD, sebagaimana dilansir Daily Mail.

“Jika interogator tidak dapat membedakan dengan andal antara manusia dan mesin, maka mesin tersebut dikatakan telah lulus."

Peneliti menggunakan empat model AI – GPT-4.5, yang dirilis pada Februari, iterasi sebelumnya yang disebut GPT-4o, model andalan Meta LLaMa, dan program chat era 1960-an yang disebut ELIZA.

Tiga yang pertama adalah 'model bahasa besar' (LLM) – algoritma pembelajaran mendalam yang dapat mengenali dan menghasilkan teks berdasarkan pengetahuan yang diperoleh dari kumpulan data besar.

Para ahli merekrut 126 mahasiswa sarjana dari University of California San Diego dan 158 orang dari kumpulan data daring Prolific.

Peserta melakukan percakapan daring selama lima menit secara bersamaan dengan peserta manusia lain dan salah satu AI – tetapi mereka tidak tahu yang mana yang mana dan mereka harus menilai mana yang menurut mereka manusia.

Ketika diminta untuk mengadopsi persona seperti manusia, GPT-4.5 dinilai sebagai manusia sebanyak 73 persen dari waktu – lebih sering daripada peserta manusia yang sebenarnya dipilih. Persentase yang tinggi tersebut menunjukkan bahwa manusia lebih unggul daripada peluang dalam menentukan apakah GPT-4.5 adalah manusia atau mesin.