Sebuah hal baru yang misterius bot obrolan AI yang disebut “gpt2-chatbot” menarik perhatian minggu ini setelah tersedia di situs pembandingan model bahasa besar, LMSYS Org. Tidak ada yang tahu dari mana asalnya, tetapi banyak yang menganggapnya memiliki kemampuan yang kurang lebih sama dengan GPT-4 OpenAI. Hal ini menempatkan gpt2-chatbot dalam kelas model AI langka yang hanya mampu dicapai oleh segelintir pengembang di seluruh dunia.

“Tidak ada yang tahu siapa yang membuatnya atau apa itu, tapi saya telah sedikit bermain-main dengannya dan tampaknya tingkat kemampuannya sama kasarnya dengan GPT-4,” Ethan Mollick, seorang Profesor yang meneliti kecerdasan buatan di Wharton School dari University of Pennsylvania, mengatakan dalam a menciak pada hari Senin.

Komunitas AI online menjadi heboh dengan gpt2-chatbot anonim. Satu pengguna X mengklaim bahwa gpt2-chatbot hampir mengkodekan tiruan sempurna dari game seluler Flappy Bird. Pengguna X lain mengatakan itu memecahkan masalah Soal Olimpiade Matematika Internasional dalam satu tembakan. Di thread Reddit yang panjang, pengguna berspekulasi liar tentang asal usul gpt2-chatbot dan berdebat apakah itu berasal dari OpenAI, Googleatau Antropis. Tidak ada bukti untuk klaim ini, namun tweet dari CEO OpenAI Sam Altman dan eksekutif lainnya menambah bahan bakar ke dalam api.

Anda dapat mencoba sendiri gpt2-chatbot di Situs web LMSYS Org. Navigasikan ke “Obrolan Langsung” atau “Arena (berdampingan)” dan pilih dari menu tarik-turun. LMSYS Org mengatakan di dalamnya blog kebijakan bahwa pengembang model AI tertentu dapat menguji model anonim yang belum dirilis sebelum rilis yang lebih luas. Hal ini membuat banyak orang percaya bahwa gpt2-chatbot adalah model anonim dari pengembang AI besar.

“Untuk memperjelas, mengikuti kebijakan kami, kami telah bermitra dengan beberapa pengembang model untuk menghadirkan model baru mereka ke platform kami untuk pengujian pratinjau komunitas,” kata LMSYS Org dalam sebuah menciak pada hari Senin, menanggapi thread tentang gpt2-chatbot. “Model-model ini hanya untuk pengujian dan tidak akan terdaftar di papan peringkat sampai dipublikasikan.”

LMYSYS Org dan OpenAI tidak segera menanggapi permintaan komentar Gizmodo.

Dalam pengujian terbatas Gizmodo, kami menemukan gpt2-chatbot memiliki kemampuan yang mirip dengan model AI terkemuka dari Anthropic dan OpenAI. Ini menunjukkan perilaku eksklusif untuk model bahasa besar tingkat lanjut, memberikan alasan dengan baik dan menguraikan rencana terperinci untuk tugas-tugas rumit. Berikut beberapa contoh kami yang membandingkan gpt2-chatbot (kiri) dan model Claude Opus Anthropic (kanan).

Petunjuk instruksi: gpt2-chatbot (kiri) vs. Claude 3 Opus (kanan)
Tangkapan layar: Organisasi LMSYS

Prompt penalaran: gpt2-chatbot (kiri) vs. Claude 3 Opus (kanan)

Prompt penalaran: gpt2-chatbot (kiri) vs. Claude 3 Opus (kanan)
Tangkapan layar: Organisasi LMSYS

Seorang profesor teknik komputer di Universitas Wisconsin menemukan bahwa gpt2-chatbot dapat melakukan tugas yang tidak dapat dilakukan oleh model AI terkemuka lainnya. Dimitris Papailiopoulos meminta gpt2-chatbot untuk memecahkan teka-teki matematika yang melibatkan pembelajaran beberapa aturan yang tidak jelas. AI sebagian besar kesulitan menjawab pertanyaan seperti ini.

Pada akhirnya, hanya ada sedikit informasi yang tersedia tentang gpt2-chatbot. Namun, tampak jelas bahwa ada pemain kuat di balik model AI ini. Dalam beberapa minggu mendatang, pembuat dan asal muasal gpt2-chatbot kemungkinan akan diketahui publik. Ini bisa berarti model AI baru akan segera hadir atau mungkin akan ada pengembang AI baru yang akan hadir.

Fuente