Meta Rilis Chameleon, Model AI Open Source Mirip Chat-GPT

Rahman Asmardika, Jurnalis
Jum'at 21 Juni 2024 18:19 WIB
Foto: Reuters.
Share :

JAKARTA - Meta secara publik merilis rangkaian model AI baru, yang disebut Chameleon, yang sebanding dengan alat komersial seperti Gemini Pro dan GPT-4V.

Sebuah makalah yang membahas berbagai hal terkait AI ini menunjukkan bahwa Chameleon, yang hadir dengan versi parameter 7 miliar dan 34 miliar, mampu memahami dan menghasilkan gambar dan teks.

Chameleon juga dapat memproses kombinasi teks dan gambar (yang mungkin terkait satu sama lain) dan menghasilkan respons yang bermakna, kata Meta, sebagaimana dilansir Tom’s Guide.

Anda bisa memotret isi lemari es Anda dan menanyakan apa yang bisa Anda masak hanya dengan bahan-bahan yang Anda miliki. Hal ini tidak mungkin terjadi pada model AI generasi Llama dan membawa open source lebih dekat ke model visi mainstream yang lebih tinggi dari OpenAI dan Google.

Setelah makalah tersebut dipublikasikan, tim Fundamental AI Research (FAIR) di Meta kini telah merilis model tersebut secara publik untuk tujuan penelitian, meskipun dengan beberapa keterbatasan.

Penulis makalah ini mengatakan bahwa kunci kesuksesan Chameleon adalah arsitekturnya yang sepenuhnya berbasis token. Model belajar untuk mempertimbangkan gambar dan teks secara bersamaan, hal ini tidak mungkin dilakukan pada model yang menggunakan encoder terpisah untuk setiap masukan.

Tantangan teknis yang harus diatasi oleh tim Meta termasuk tantangan terkait stabilitas dan penskalaan pengoptimalan. Mereka melakukannya dengan menggunakan metode dan teknik pelatihan baru.

 

Pada akhirnya bagi pengguna, ini berarti Chameleon harus mampu menangani perintah yang memerlukan keluaran berupa teks dan gambar dengan mudah.

Pengguna, misalnya, dapat meminta Chameleon untuk membuat rencana perjalanan untuk mengalami titik balik matahari musim panas dan model AI harus dapat memberikan gambar yang relevan untuk menyertai teks yang dihasilkannya.

Para peneliti mengatakan bahwa menurut evaluasi manusia, Chameleon menyamai atau melampaui kinerja model seperti Gemini Pro dan GPT-4V ketika perintah atau keluaran berisi rangkaian campuran gambar dan teks. Namun, evaluasi interpretasi infografis dan grafik tidak disertakan.

Model Meta yang dirilis secara publik hanya dapat menghasilkan keluaran teks dan tingkat keamanannya sengaja ditingkatkan.

Namun, pada Mei, Armen Aghajanyan, salah satu orang yang mengerjakan proyek tersebut, menulis di X bahwa model mereka "telah menyelesaikan pelatihan 5 bulan yang lalu" dan mengklaim bahwa mereka telah "kemajuan yang signifikan sejak saat itu".

Bagi para peneliti, Chameleon mewakili sumber inspirasi cara alternatif untuk melatih dan merancang model AI. Bagi kita semua, ini berarti kita selangkah lebih dekat untuk memiliki asisten AI yang dapat lebih memahami konteks operasi mereka tanpa harus menggunakan salah satu platform tertutup.

(Erha Aprili Ramadhoni)

Halaman:
Share :
Follow WhatsApp Channel Okezone untuk update berita terbaru setiap hari
Topik Artikel :
Berita Terkait
Terpopuler
Telusuri berita Ototekno lainnya