Kerry Wan/ZDNET

Saat saya menunggu melewati antrean jurnalis dan masuk ke ruang demo kecil, mata saya terpaku pada monitor yang terpasang di dinding dan Pixel 8 Pro di salah satu dari dua tangan pakar produk Google. Pertunjukan Project Astra yang direkam sebelumnya, yang ditampilkan pada keynote I/O perusahaan satu jam sebelumnya, diterima dengan baik — dan merupakan tindakan yang sulit untuk diikuti. Sekarang, dengan ponselku tersimpan di saku dada, demo dunia nyata akan segera dimulai.

Juga: Google Glass vs. Project Astra: Sergey Brin tentang perangkat AI yang dapat dikenakan dan kasus penggunaan teratasnya

Project Astra adalah gagasan Google DeepMind; visi perusahaan tentang asisten AI multimoda dan bertenaga super yang dapat memproses informasi visual, menunjukkan alasan, dan mengingat apa yang diberitahukan atau diperlihatkan. Ini tidak akan tersedia seperti fitur Gemini baru yang hadir di perangkat Android, namun tujuan akhirnya, setidaknya untuk saat ini, adalah menanamkan teknologi tersebut ke dalam ponsel dan mungkin perangkat yang dapat dikenakan, menjadi asisten sehari-hari dalam segala hal yang kita lakukan.

Untuk demonya, saya disajikan dengan empat kasus penggunaan: Storyteller, Pictionary, Aliteration, dan Free-form. Semuanya cukup jelas dan tidak ada yang tidak dapat dilakukan oleh model AI generatif yang ada, namun kedalaman, kecepatan, dan kemampuan beradaptasi dalam memberikan jawaban adalah keunggulan Project Astra.

Pertama, saya menaruh merica pada feed kamera Astra dan memintanya untuk membuat aliterasi. “Pengelompokan emas bersinar dengan megah,” jawabnya dengan percaya diri, meski salah. “Tunggu, ini lada,” kataku pada Astra. “Mungkin paprika yang sudah dipoles berpose dengan damai.” Jauh lebih baik.

Juga: 9 pengumuman terbesar di Google I/O 2024: Gemini, Search, Project Astra, dan banyak lagi

Saya kemudian menambahkan mainan es krim dan pisang ke dalam adonan dan bertanya kepada Astra apakah mereka bisa membuatkan makan siang yang enak. “Mungkin mengemas protein memberikan semangat,” sarannya, memahami ketidakseimbangan nutrisi di antara ketiga makanan tersebut dan, yang mengejutkan saya, tetap berpegang pada aliterasi. Jawaban Astra relatif cepat, cukup membuat saya enggan mengeluarkan Rabbit R1 saya untuk membandingkan.

Mungkin yang lebih penting adalah betapa natural suara AI — berbagi nada yang mirip dengan GPT4-o OpenAI — saat saya mengarahkan kamera Pixel 8 Pro dan mengajukan pertanyaan acak tentang berbagai objek di dalam ruangan. Suara yang terdengar alami sejalan dengan kemampuan Storyteller dan Pictionary, yang keduanya membuat anak-anak, siswa, dan orang-orang yang memiliki waktu luang tetap terhibur.

Juga: Chatbot AI terbaik tahun 2024: ChatGPT dan alternatifnya

Salah satu masalah yang saya temui selama demo saya yang berdurasi sekitar lima menit adalah bagaimana Astra sering menjeda di tengah respons, mungkin menafsirkan suara obrolan eksternal dan aktivasi sepak bola di sekitar (di mana Google mendemonstrasikan bagaimana AI-nya dapat menilai bentuk tendangan Anda) saat saya menyela. . Kemampuan untuk menginterupsi asisten suara adalah langkah terbaru untuk mencapai percakapan yang lebih alami.

Namun, dalam kasus ini, sensitivitas tinggi dari mikrofon yang dikenakan di kepala salah satu anggota staf mungkin tidak mendukung demo tersebut. Hal ini membuat saya percaya bahwa di lingkungan yang lebih sibuk, seperti saat saya sedang melakukan perjalanan melalui kereta bawah tanah NYC atau di pameran dagang, berkomunikasi dengan Astra mungkin lebih sulit daripada berbicara dengan orang di samping saya.

Selain itu: AI Generatif dapat mengubah pengalaman pelanggan. Namun hanya jika Anda fokus pada bidang lain terlebih dahulu

Masalah lain dengan Project Astra adalah kemampuan memorinya. Saat ini, AI hanya mengingat dan melacak lokasi objek yang ditampilkan dalam sesi obrolan (hanya beberapa menit). Meskipun AI dapat mengingat bahwa saya telah meletakkan ponsel saya di saku dada jaket saya pada awal demo, secara teoritis, AI tidak akan dapat memberi tahu saya di mana saya meninggalkan remote TV pada malam sebelumnya — ketika fitur seperti itu akan sangat bermanfaat.

Salah satu peneliti mengatakan kepada saya bahwa memperluas kapasitas memori Astra — yang berjalan di cloud dan bukan di perangkat — tentu saja mungkin dilakukan. Pengorbanan untuk pencapaian kinerja seperti itu kemungkinan besar adalah masa pakai baterai, terutama jika tujuannya adalah untuk menyesuaikan teknologi tersebut dengan perangkat yang dapat dikenakan setipis dan seringan kacamata.

Pada akhirnya, Google DeepMind memberi saya visi yang kuat tentang seperti apa masa depan interaksi AI. Mereka hanya memiliki beberapa kerutan yang perlu dihaluskan sebelum saya siap memperkenalkan asisten suara lain ke dalam hidup saya.



Fuente