LG AI Research telah mengumumkan peluncuran model kecerdasan buatan (AI) open source pertama Korea Selatan EXAONE 3.0. Peluncuran ini menjadikan Korea Selatan memasuki bidang AI global yang didominasi oleh raksasa teknologi Amerika Serikat (AS) dan perusahaan-perusahaan rintisan di China dan Timur Tengah.
Perlu dicatat, saat ini model ini hanya mendukung dua bahasa – Inggris dan Korea.
EXAONE 3.0 adalah model open source, yang kabarnya didasarkan pada arsitektur Transformer khusus Decoder. Model ini memiliki 7,8B parameter dan 8T data pelatihan (token).
"Di antara jajaran model bahasa EXAONE 3.0 yang dibuat untuk berbagai keperluan, model penyesuaian instruksi 7.8B sedang di-open source terlebih dahulu sehingga dapat digunakan untuk penelitian," kata siaran pers LG, sebagaimana dilansir Gizmochina.
Perusahaan tersebut berharap bahwa rilis model ini akan membantu peneliti AI baik di dalam negeri maupun di luar negeri melakukan penelitian yang lebih bermakna dan membantu ekosistem AI bergerak selangkah lebih maju.
Menurut pengujian perusahaan, kemampuan bahasa Inggris model tersebut telah mencapai "tingkat teratas di dunia". Skor rata-rata kasus penggunaan nyata dilaporkan berada di peringkat pertama, melampaui sejumlah model seperti Llama 3.0.
Dalam hal perhitungan dan pengodean matematika, EXAONE 3.0 juga berada di peringkat pertama dalam skor rata-rata dan memiliki kemampuan penalaran yang kuat.
Belum lagi, EXAONE 3.0 menduduki peringkat pertama dalam skor rata-rata untuk kasus penggunaan aktual dan benchmark tunggal di Korea. Model ini diklaim dapat mengurangi waktu inferensi hingga 56%, penggunaan memori hingga 35%, dan biaya pengoperasian hingga 72% dibandingkan dengan model generasi sebelumnya.
Model terbaru ini dilaporkan telah dilatih pada 60 juta kasus data profesional yang terkait dengan paten, kode, matematika, dan kimia. Perusahaan berencana untuk memperluas data pelatihan menjadi 100 juta kasus di berbagai bidang pada akhir tahun.
Untuk mengurangi konsumsi daya dalam mengoperasikan model AI, LG AI Research berfokus pada penelitian teknologi pengoptimalan dan membuat model menjadi ringan, yang mana mereka berhasil dan mengurangi ukuran model hingga 97% sekaligus meningkatkan kinerja dibandingkan dengan EXAONE 1.0.
(Rahman Asmardika)