Apa perbedaan antara orang-orang ini dan ChatGPT dan untuk apa?

Ringkasan
Beberapa pesaing di pasar AI baru-baru ini meluncurkan model yang lebih kecil dan kurang bertenaga untuk digunakan pada perangkat seluler seperti komputer, notebook, tablet, dan workstation.




Sally Beatty

Foto: Pengungkapan

Saya tahu, sulit untuk mengikuti semua tren di dunia AI yang hiruk pikuk, apalagi menemukan pola logis dari segudang peluncuran yang terjadi setiap minggunya, namun satu hal yang menjadi jelas bagi saya adalah beberapa pesaing di pasar ini baru-baru ini meluncurkan model yang lebih kecil dan lebih murah. kuat dibandingkan kelas beratnya (GPT, Gemini, Claude, LLama dll).

Diantaranya Phi-3 dari Microsoft yang dikemas dalam cerita lucu tentang dongeng untuk anak-anak, Gemma dari Google dalam dua versi (parameter 2 dan 7 miliar), LLama 3 8b dari Meta, dan Claude Haiku dari Anthropic.

Dan mengapa kami menyebutnya ‘kecil’? Karena 2 miliar parameter (sedikit informasi yang digunakan dalam pelatihan) berarti sekitar 0,2% volume yang dibutuhkan untuk melatih sepupu besarnya, seperti GPT-4.

Mereka kecil seperti itu karena suatu alasan. Model besar memerlukan mesin yang sangat, sangat berat untuk dijalankan, sehingga hampir tidak mungkin untuk menjalankannya di komputer lokal, dan terlebih lagi di ponsel. Bingo!

Model kecil baru ini dirancang untuk bekerja pada perangkat seluler, notebook, tablet, dan workstation. Oleh karena itu, sejak peluncurannya, bot kecil atau aplikasi cerdas akan berjalan lebih sederhana.

Hal ini membuka kemungkinan penggunaan yang berbeda oleh pengembang, dan pembangunan aplikasi yang ringan dan murah, dengan fungsi tertentu.

Apalagi saat kita membangun aplikasi menggunakan LLM, seringkali kita tidak perlu menggunakan semua pengetahuan yang dibawanya, melainkan hanya elemen fungsional yang memungkinkan teknologi ini mengatur data tidak terstruktur dengan cara yang cerdas.

Kami telah menguji beberapa model ini dengan hasil yang baik, dan meskipun model tersebut tidak mengubah aturan mainnya, model tersebut memungkinkan arsitektur yang lebih fleksibel untuk memecahkan masalah praktis.

Oleh karena itu, mereka datang untuk tinggal. Dan segera, mereka akan segera berada di chatbots dan aplikasi yang sangat dekat dengan kita masing-masing, seperti bot Whatsapp dan Instagram baru, yang belum tiba di Brasil, tetapi akan segera hadir.

Dan bagi siapa saja yang ingin mempelajari topik ini lebih dalam, saya sarankan untuk membaca makalah ini lakukan Sally Beatty di situs Microsoft.

Alex Winetzki

Konten terbaik di email Anda secara gratis. Pilih Buletin Terra favorit Anda. Klik disini!

Fuente