Pada akhirnya bagi pengguna, ini berarti Chameleon harus mampu menangani perintah yang memerlukan keluaran berupa teks dan gambar dengan mudah.
Pengguna, misalnya, dapat meminta Chameleon untuk membuat rencana perjalanan untuk mengalami titik balik matahari musim panas dan model AI harus dapat memberikan gambar yang relevan untuk menyertai teks yang dihasilkannya.
Para peneliti mengatakan bahwa menurut evaluasi manusia, Chameleon menyamai atau melampaui kinerja model seperti Gemini Pro dan GPT-4V ketika perintah atau keluaran berisi rangkaian campuran gambar dan teks. Namun, evaluasi interpretasi infografis dan grafik tidak disertakan.
Model Meta yang dirilis secara publik hanya dapat menghasilkan keluaran teks dan tingkat keamanannya sengaja ditingkatkan.
Namun, pada Mei, Armen Aghajanyan, salah satu orang yang mengerjakan proyek tersebut, menulis di X bahwa model mereka "telah menyelesaikan pelatihan 5 bulan yang lalu" dan mengklaim bahwa mereka telah "kemajuan yang signifikan sejak saat itu".
Bagi para peneliti, Chameleon mewakili sumber inspirasi cara alternatif untuk melatih dan merancang model AI. Bagi kita semua, ini berarti kita selangkah lebih dekat untuk memiliki asisten AI yang dapat lebih memahami konteks operasi mereka tanpa harus menggunakan salah satu platform tertutup.
(Erha Aprili Ramadhoni)