Kami selangkah lebih dekat untuk mendefinisikan AI open source — namun tidak semua orang senang

gambar pusaran lubang hitam-1960070453

zf L/Getty Gambar

HONG KONG — Mengutip mendiang John F. Kennedy, kami memilih untuk mendefinisikan AI terbuka bukan karena mudah, namun karena sulit; karena tujuan itu akan membantu untuk meningkatkan dan mengukur kekuatan dan kemampuan kita.

Stefano Maffulli, kepala Open Source Initiative (OSI), mengatakan kepada saya bahwa perangkat lunak dan data yang menggabungkan kecerdasan buatan (AI) dengan lisensi yang ada adalah salah. “Jadi,” kata Maffulli, “kita perlu menciptakan definisi baru tentang AI terbuka.”

Juga: Bagaimana open source membawa AI ke arus utama

Organisasi induk Firefox, Mozilla Foundation, setuju.

Raksasa teknologi besar, jelas perwakilan Mozilla, “belum mengikuti semua standar terbuka untuk model AI mereka.” Selain itu, definisi baru ini “membantu pembuat undang-undang yang berupaya membuat undang-undang dan peraturan untuk melindungi konsumen dari bahaya AI.”

OSI telah bekerja keras untuk menciptakan definisi komprehensif tentang AI terbuka, mirip dengan Definisi Sumber Terbuka untuk perangkat lunak. Upaya sulit ini dihadapkan pada kebutuhan yang jelas untuk memahami apa yang dimaksud dengan solusi AI terbuka pada saat banyak perusahaan mengklaim model AI mereka adalah sumber terbuka tanpa terbuka sama sekali, seperti Llama 3,1 dari Meta.

Versi terbaru dari OSI Open-Source AI Definition, 0.0.9, berisi beberapa perubahan besar. Ini adalah:

  • Definisi logis: Definisi tersebut sekarang dengan jelas menunjukkan model dan bobot/komponen sebagai bagian dari “sistem” AI, menekankan bahwa semua komponen harus memenuhi persyaratan terbuka. Pemahaman ini memastikan bahwa keseluruhan sistem AI, bukan hanya bagiannya saja, mengikuti prinsip keterbukaan.
  • Aplikasi data pelatihan: Informasi pelatihan bermanfaat tetapi tidak penting untuk meningkatkan perilaku AI. Keputusan tersebut menyoroti tantangan berbagi data, termasuk masalah hukum dan privasi. Dokumen tersebut membagi data akademik menjadi data terbuka, publik, dan non-publik, yang masing-masing berisi pedoman untuk meningkatkan transparansi dan pemahaman tentang bias sistem AI.
  • Jadwal terpisah: Daftar evaluasi izin dipisahkan dari dokumen penjelasan utama, sesuai dengan Model Openness Framework (MOF). Pemisahan ini memungkinkan diskusi difokuskan pada identifikasi AI open source dan menyimpan semua informasi dalam definisinya.

Seperti yang dijelaskan secara rinci oleh CEO Linux Foundation Jim Zemlin pada Open Source Summit China, MOF “adalah cara untuk membantu memeriksa apakah suatu model open source atau tidak.

Di Kementerian Keuangan, tambah Zemlin, ada tiga wilayah terbuka. “Tingkat tertinggi, tingkat pertama, adalah definisi sains terbuka di mana data, setiap komponen yang digunakan, dan semua instruksi harus berjalan dan membuat model Anda dengan cara yang sama. Terbuka, tetapi sebagian besar, di tingkat ketiga. tingkat, Anda memiliki area di mana datanya tidak ada, dan data yang mendeskripsikan data akan ditemukan modelnya terbuka — tidak semua data tersedia.”

Juga: Linus Torvalds berbicara tentang AI, adopsi Rust, dan mengapa kernel Linux adalah ‘satu-satunya hal yang penting’

Ketiga bagian ini – sebuah konsep yang juga muncul dalam pengumuman – akan sulit diterima oleh sebagian penganut open source. Perdebatan mengenai model dan data pelatihan ini akan muncul seiring dengan berlanjutnya perdebatan mengenai metode AI dan pembelajaran mesin (ML) mana yang merupakan sumber terbuka dan mana yang tidak.

Mendefinisikan AI Open Source telah dilakukan melalui kerja sama dengan berbagai pemangku kepentingan di seluruh dunia. Ini termasuk, antara lain, Code for America, Wikimedia Foundation, Creative Commons, Linux Foundation, Microsoft, Google, Amazon, Meta, Hugging Face, Apache Software Foundation, dan Persatuan Telekomunikasi Internasional PBB.

OSI telah mengadakan banyak balai kota dan lokakarya untuk mengumpulkan pesan-pesannya, memastikan bahwa maknanya inklusif dan mewakili beragam perspektif. Pekerjaan ini masih berlangsung.

Selain itu: Sonos gagal dan jutaan perangkat dapat menggunakannya – mengapa audio terbuka adalah satu-satunya harapan kami

Definisi ini akan terus dikembangkan dan disempurnakan melalui pertemuan internasional dan mengumpulkan umpan balik serta persetujuan dari berbagai yurisdiksi.

Maffulli dari OSI tahu bahwa tidak semua orang akan senang dengan definisi ini. Memang benar, sebelum versi ini muncul, Kepala Strategi Teknis Sumber Terbuka AWS, Tom Callaway, menulis di LinkedIn, “Saya sangat yakin (dan banyak orang lain secara terbuka) bahwa Definisi AI Sumber Terbuka tidak menjamin bahwa Mesin AI melestarikan kebebasan pengguna yang tidak terbatas, penyalinan, distribusi, pembelajaran, adaptasi, dan peningkatan.”

Kini setelah kelompok ini mulai sadar, saya berharap pendapat orang lain juga didengar. OSI berharap untuk menguraikan definisi formal dari istilah tersebut pada konferensi All Things Open pada bulan Oktober 2024. Jika semuanya berjalan dengan baik, hasilnya akan menjadi definisi yang disetujui oleh banyak orang – jika tidak semua – yang mendorong transparansi, kolaborasi, dan inovasi. dalam sistem AI terbuka.

Baca juga:  Mainkan lagu musim panas Anda dengan headphone Bose QuietComfort 2 seharga $85 pada Hari Peringatan

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *