Dunia kecerdasan buatan (AI) mengalami lonjakan pesat dalam pengembangan model open source. Namun, hingga kini, belum ada definisi yang benar-benar jelas tentang apa yang dimaksud dengan “AI open source.” Menjawab kebutuhan ini, Open Source Initiative (OSI) memperkenalkan definisi resmi untuk AI open source yang menekankan pentingnya transparansi data pelatihan.
Daftar Isi
OSI Menetapkan Standar Transparansi untuk AI Open Source
Menurut OSI, agar sebuah AI bisa disebut “open source,” perusahaan harus mengungkap informasi rinci tentang data yang digunakan untuk melatih model AI tersebut. Ini termasuk:
- Deskripsi lengkap data pelatihan yang meliputi asal, cakupan, dan karakteristik data, termasuk data yang tidak dapat dibagikan.
- Daftar data pelatihan yang tersedia untuk umum dan cara mengaksesnya.
- Daftar data dari pihak ketiga yang digunakan dalam pelatihan, termasuk informasi tentang sumber data yang memerlukan biaya.
Langkah ini diambil untuk memastikan bahwa pengembang yang ingin membuat model AI mereka sendiri dapat memperoleh pemahaman menyeluruh tentang data dan metode yang digunakan dalam pengembangan model open source.
Mengapa Definisi Ini Penting?
Konsep open source telah lama digunakan dalam pengembangan perangkat lunak, di mana kode sumber tersedia secara publik agar dapat dimodifikasi dan dibagikan. OSI memiliki definisi yang diakui secara internasional untuk perangkat lunak open source, yang digunakan sebagai acuan oleh berbagai pemerintah dan organisasi. Kini, OSI ingin menerapkan prinsip serupa pada AI dengan menetapkan definisi yang lebih jelas.
Lea Gimpel dari Digital Public Goods Alliance menekankan pentingnya standarisasi dalam AI open source, mengingat manfaat kolaboratif yang dihadirkan oleh model ini. “Ada banyak inisiatif untuk mendefinisikan AI open source agar kita dapat memahami aspek apa saja yang perlu dibuka,” ujarnya pada acara Carnegie India Global Technology Summit tahun lalu.
Persyaratan Tambahan untuk AI Open Source
Selain rincian data pelatihan, OSI menggariskan beberapa kriteria tambahan yang harus dipenuhi agar sebuah model AI dapat dianggap open source. Kriteria ini meliputi:
- Kode sumber lengkap yang digunakan dalam pelatihan dan pengoperasian model, termasuk spesifikasi terkait pengolahan, penyaringan, dan arsitektur model.
- Parameter model, seperti bobot model, yang mempengaruhi keluaran AI berdasarkan input yang diberikan.
Perusahaan yang merilis model AI open source juga diperbolehkan untuk meminta pengguna yang mengembangkan produk berbasis model tersebut untuk merilis karya mereka dengan syarat yang sama. OSI mengakui adanya tantangan hukum terkait distribusi parameter model, namun percaya bahwa solusi akan muncul seiring waktu.
Contoh Perusahaan yang Mengadopsi dan Membatasi Open Source AI
Model LLAMA Meta
Meta mengklaim model bahasa besar mereka, seperti Llama 2 dan Llama 3, sebagai open source dengan menyediakan bobot model secara publik. Namun, Meta tidak mengungkapkan detail dataset yang digunakan untuk pelatihan. Selain itu, model Llama memiliki batasan komersial, di mana organisasi dengan lebih dari 700 juta pengguna aktif per bulan harus meminta izin khusus sebelum menggunakan model ini. Pembatasan ini membuat Llama sulit memenuhi definisi OSI tentang AI open source.
Model OpenELM Apple
Apple memperkenalkan model OpenELM, sebuah rangkaian AI open source yang memberikan kebebasan bagi pengguna untuk memodifikasi, mendistribusikan, dan menggunakan model ini tanpa batasan. Apple bahkan menyediakan kerangka kerja lengkap untuk melatih model berdasarkan dataset yang tersedia secara publik, seperti Wikipedia, Reddit, Github, dan arXiv.org. Langkah ini menunjukkan upaya transparansi yang lebih tinggi dibandingkan dengan model Meta.
Dukungan untuk Definisi OSI
Sejumlah organisasi terkemuka, termasuk Mozilla Foundation, Common Crawl, Bloomberg Engineering, dan Open Infra Foundation, telah memberikan dukungan untuk definisi open source AI versi OSI. Namun, beberapa nama besar seperti Meta belum memberikan dukungan mereka, mungkin karena model mereka tidak memenuhi kriteria transparansi penuh yang ditetapkan oleh OSI.
Penutup
Dengan definisi resmi ini, OSI berharap dapat mendorong transparansi dan kolaborasi dalam pengembangan AI open source, menjadikan pengembangan AI lebih inklusif dan akuntabel. Standarisasi ini memberikan kesempatan bagi komunitas pengembang untuk menciptakan inovasi tanpa harus memulai dari awal. Langkah OSI ini menandai babak baru dalam ekosistem AI, di mana keterbukaan dan kolaborasi menjadi landasan penting.