Para peneliti telah menemukan bahwa sistem AI baru Apple, ReALM, melampaui kemampuan GPT-4 OpenAI.

Kertas berjudul “ReALM: Resolusi Referensi sebagai Pemodelan Bahasa” mengkaji masalah resolusi referensi. Referensi adalah proses linguistik di mana satu kata dalam sebuah kalimat atau wacana merujuk pada kata atau entitas lain. Tugas menyelesaikan referensi ini dikenal sebagai Resolusi Referensi.

Para peneliti menyatakan bahwa meskipun model bahasa besar (LLM) sangat berguna untuk berbagai tugas, penggunaannya dalam resolusi referensi, terutama untuk entitas non-percakapan, masih kurang dimanfaatkan.

Menurut penelitian, versi terkecil ReALM dibandingkan dengan GPT-3.5 dan GPT-4, dan berhasil mencapai performa yang sebanding dengan GPT-4, sedangkan model yang lebih besar secara substansial mengunggulinya.

Menjelang WWDC 2024 dan peluncuran iOS 18 yang diantisipasi pada bulan Juni, ekspektasi tinggi terhadap debut Siri 2.0 yang canggih. Apakah ReALM akan diintegrasikan ke dalam Siri pada saat itu masih belum pasti.

Usaha Apple baru-baru ini dalam bidang AI tidak luput dari perhatian, ditandai dengan diperkenalkannya model dan alat baru yang bertujuan untuk meningkatkan efisiensi AI pada perangkat yang lebih kecil, serta kemitraan strategis. Perkembangan ini menyoroti strategi perusahaan untuk menempatkan AI di garis depan operasi bisnisnya.

Peluncuran ReALM mewakili inisiatif terbaru dan paling ditargetkan dari tim peneliti AI Apple untuk menyempurnakan dan mempercepat model yang ada, mendorong mereka menuju kecepatan, kecerdasan, dan efisiensi yang lebih tinggi.

Fitur utama ReALM AI Apple

ReALM dilaporkan menggunakan cara baru untuk mengubah informasi layar menjadi teks, memungkinkannya mengabaikan kebutuhan parameter pengenalan gambar dan memungkinkan pemrosesan yang lebih efisien pada perangkat AI.

Ini juga memperhitungkan apa yang ada di layar pengguna atau apa yang berjalan di latar belakang.

Hasilnya, LLM harus memungkinkan pengguna menelusuri situs web dan menginstruksikan Siri untuk menelepon bisnis. Siri kemudian dapat ‘melihat’ nomor telepon di situs web dan langsung melakukan panggilan.

Oleh karena itu, ReALM dapat secara signifikan meningkatkan kemampuan asisten suara yang sadar konteks. Dengan kemampuannya menafsirkan informasi di layar dan menggunakan konteks tambahan, pembaruan pada Siri dapat membantu menghadirkan pengalaman pengguna yang lebih lancar dan bebas genggam.

ReALM juga dapat menangani berbagai macam referensi, termasuk referensi yang bergantung pada konteks percakapan, konten di layar, dan bahkan informasi latar belakang. Hal ini penting untuk mengembangkan sistem AI yang lebih intuitif dan responsif yang dapat beradaptasi dengan kompleksitas bahasa dan konteks manusia.

Makalah ini melaporkan peningkatan besar dibandingkan sistem yang ada dengan fungsi serupa, karena model terkecilnya tampaknya mencapai keuntungan absolut lebih dari 5% untuk referensi di layar.

Gambar unggulan: Canva



Fuente