Gambar SOPA/Gambar Getty

Meskipun perusahaan teknologi berlomba untuk membangun model kecerdasan buatan yang lebih besar dan lebih baik, model yang lebih kecil masih memiliki nilai yang signifikan. Microsoft menggandakan konsep itu.

Microsoft pada hari Selasa meluncurkan Phi-3 Mini, yang pertama dari tiga model kecil yang menurut perusahaan akan diluncurkan dalam beberapa bulan mendatang. Microsoft melatih Phi-3 Mini dengan 3,8 miliar parameter, atau variabel yang digunakan model AI untuk memberikan hasil yang lebih baik. Phi-3 Mini adalah model terkecil dari tiga model yang rencananya akan diluncurkan Microsoft. Perusahaan tidak mengatakan secara pasti kapan Phi-3 Small akan dilatih pada 7 miliar parameter, atau Phi-3 Medium akan dilatih pada 14 miliar parameter.

Untuk menempatkan angka-angka parameter ini dalam perspektif, beberapa laporan telah melakukannya disarankan bahwa GPT-4 Turbo OpenAI telah dilatih pada lebih dari 1 triliun parameter. Pekan lalu, Meta mengatakan bahwa ketika model terakhir Llama 3 diluncurkan pada tahun 2024, model tersebut akan dilatih pada 700 miliar parameter.

Juga: Microsoft memperkenalkan Phi-2, model bahasa kecil yang memiliki kekuatan

Semakin banyak parameter yang dilatih pada model, semakin mampu model tersebut memberikan hasil yang diinginkan pengguna, namun hal ini memerlukan biaya. Semakin banyak parameter yang dimiliki model AI, semakin besar pula daya dan energi yang dibutuhkan untuk memberikan hasil. Meskipun lebih banyak parameter mungkin merupakan pilihan terbaik untuk kueri rumit atau penerapan AI yang sangat penting, seperti dalam layanan kesehatan, hal tersebut tidak selalu terjadi.

Memang benar, model yang lebih kecil seperti yang dikembangkan Microsoft sangat bagus untuk ponsel pintar dan perangkat berdaya rendah lainnya. Microsoft dapat menggunakan Phi-3 di perangkat seluler, di mana kinerja AI pada perangkat dibatasi oleh daya chipset dan masa pakai baterai.

Meskipun ukurannya lebih kecil, Phi-3 Mini berkinerja baik, klaim Microsoft. Dalam sebuah wawancara dengan The Verge, perusahaan mengatakan bahwa Phi-3 Mini menawarkan kinerja yang sama dengan model yang dilatih dengan lebih dari 10 kali lipat jumlah parameter yang digunakan Microsoft, dan meskipun tidak dapat menandingi GPT-4 atau GPT-4 Turbo, namun sama seperti berkemampuan seperti GPT-3.5.

Microsoft mengatakan kepada The Verge bahwa perusahaannya melatih Phi-3 Mini dengan “kurikulum” yang mencakup buku anak-anak untuk mencapai kinerja tersebut. Perusahaan ini juga menggunakan model yang lebih besar untuk membuat buku anak-anak yang dihasilkan AI untuk melengkapi materi dunia nyata.

Microsoft membuat Phi-3 Mini tersedia secara gratis di platform cloud Azure, situs kolaborasi model Hugging Face, dan layanan model AI Ollama.



Fuente