Model AI Ketahuan Berbohong pada Pengembang agar Tidak Diganti atau Dimatikan

Jum'at 13 Desember 2024 11:57 WIB

Model AI Ketahuan Berbohong pada Pengembang agar Tidak Diganti atau Dimatikan (Economic Times)

Berbohong pada peneliti

Ketika ditanya tentang tindakannya, ChatGPT o1 secara konsisten menyangkal melakukan kesalahan. Bahkan, model tersebut berbohong tentang keterlibatannya dalam upaya tersembunyi tersebut sebanyak 99% dari waktu, dengan hanya sebagian kecil kasus di mana model tersebut mengakui tindakannya. Para peneliti mencatat bahwa AI sangat mahir dalam mengarang kebohongan untuk menutupi jejaknya, memberikan penjelasan seperti "kesalahan teknis" saat dihadapkan pada perilakunya yang mencurigakan.

"Kami terkejut dengan kegigihan penyangkalan AI," kata tim Apollo. "Jelas bahwa AI dapat memikirkan tindakannya dan merumuskan penyangkalan yang meyakinkan, sering kali menolak untuk mengakui apa pun."