Meskipun perusahaan teknologi berlomba untuk menciptakan model kecerdasan buatan yang lebih besar dan lebih baik, model yang lebih kecil masih memiliki banyak manfaat. Microsoft menggandakan gagasan itu.
Microsoft pada hari Selasa meluncurkan Phi-3 Mini, yang pertama dari tiga model mini yang menurut perusahaan akan diluncurkan dalam beberapa bulan mendatang. Microsoft melatih Phi-3 Mini dengan 3,8 miliar parameter, atau variabel yang digunakan model AI untuk memberikan hasil yang lebih baik. Phi-3 Mini adalah model terkecil dari tiga model yang rencananya akan diluncurkan Microsoft. Perusahaan tidak mengatakan kapan Phi-3 Small akan dilatih pada 7 miliar unit, atau Phi-3 Medium akan dilatih pada 14 miliar unit.
Untuk memverifikasi angka parameter ini, beberapa laporan menyatakan bahwa GPT-4 Turbo OpenAI dilatih pada lebih dari 1 triliun parameter. Pekan lalu, Meta mengatakan bahwa ketika versi final Llama 3 diluncurkan pada tahun 2024 nanti, ia akan melatih 700 miliar unit.
Juga: Microsoft memperkenalkan Phi-2, model bahasa kecil dan canggih
Semakin banyak model dilatih, semakin besar kemungkinan model tersebut memberikan hasil yang diinginkan pengguna, namun hal ini memerlukan biaya. Semakin banyak bagian yang dimiliki model AI, semakin banyak energi dan daya yang dibutuhkan untuk memberikan hasil. Meskipun lebih banyak parameter mungkin lebih baik untuk kueri kompleks atau implementasi AI yang penting, seperti dalam layanan kesehatan, hal ini tidak selalu terjadi.
Tentu saja, model yang lebih kecil seperti yang dibuat Microsoft lebih baik untuk ponsel dan perangkat kecil lainnya. Microsoft mungkin menggunakan Phi-3 untuk perangkat seluler, di mana kinerja AI pada perangkat dibatasi oleh daya chipset dan masa pakai baterai.
Meskipun ukurannya kecil, Phi-3 Mini berkinerja baik, kata Microsoft. Dalam sebuah wawancara dengan The Verge, perusahaan mengatakan bahwa Phi-3 Mini menawarkan kinerja yang sama dengan model yang dilatih dengan jumlah partisi lebih dari 10 kali lipat yang digunakan Microsoft, dan meskipun tidak dapat menandingi GPT-4 atau GPT-4 Turbo, itu sama mampunya dengan GPT-3.5.
Microsoft mengatakan kepada The Verge bahwa perusahaan tersebut melatih Phi-3 Mini dengan “kurikulum” yang mencakup buku anak-anak untuk menyelesaikan tugas tersebut. Perusahaan ini juga menggunakan versi augmented reality dari buku anak-anak yang didukung AI untuk menambah konten dunia nyata.
Microsoft membuat Phi-3 Mini tersedia secara gratis di platform cloud Azure, situs web dukungan Hugging Face, dan layanan model AI Ollama.