OpenAI telah meluncurkan alat baru yang menciptakan kembali suara seseorang hanya dengan rekaman audio 15 detik.
Dijuluki Voice Engine, model ini memerlukan satu klip berdurasi 15 detik untuk mempelajari suara seseorang dan cara mereka berbicara. Dari sana, pengguna dapat memasukkan teks agar teks tersebut mengatakan apa pun yang mereka inginkan dengan suara yang terdengar realistis dan menyertakan emosi. Perusahaan tersebut mengatakan bahwa mereka mengembangkan Voice Engine pada tahun 2022 dan telah menggunakannya dalam suara preset, namun ini adalah pertama kalinya dibahas menggunakan suara asli seseorang. OpenAI juga mengakui dalam postingan blognya pada hari Jumat (29 Maret) mengenai implikasi yang jelas dan berpotensi berbahaya.
“Kami mengambil pendekatan yang hati-hati dan terinformasi terhadap rilis yang lebih luas karena potensi penyalahgunaan suara sintetis,” tulis OpenAI dalam postingan blognya. “Kami berharap dapat memulai dialog mengenai penerapan suara sintetis yang bertanggung jawab, dan bagaimana masyarakat dapat beradaptasi dengan kemampuan baru ini.”
OpenAI menambahkan bahwa berdasarkan bagaimana percakapan tersebut berlangsung, mereka akan memutuskan bagaimana — atau bahkan apakah — mereka akan merilis Voice Engine ke publik.
Perusahaan tersebut menulis, “Kami akan membuat keputusan yang lebih tepat mengenai apakah dan bagaimana menerapkan teknologi ini dalam skala besar.”
Implikasi dari Voice Engine sangat besar. Meskipun dapat digunakan dalam berbagai cara penting, seperti merekam presentasi dengan cepat atau berkomunikasi dengan lebih efektif, tidak sulit untuk menangkap suara orang lain dan menggunakannya untuk tujuan jahat. Memang benar, banyak jenis penipuan seperti ini sudah ada dan digunakan untuk menipu orang agar mengirimkan uang dan berbagi informasi dengan penipu.
Kami membagikan pembelajaran kami dari pratinjau skala kecil Voice Engine, sebuah model yang menggunakan masukan teks dan satu sampel audio berdurasi 15 detik untuk menghasilkan ucapan yang terdengar alami dan sangat mirip dengan pembicara aslinya. https://t.co/yLsfGaVtrZ29 Maret 2024
OpenAI berpendapat bahwa dengan risiko itulah mendapatkan umpan balik menjadi sangat penting. Perusahaan tersebut mengatakan pihaknya sedang menjalin kerja sama dengan pemerintah, perusahaan media, perusahaan hiburan, dan lembaga pendidikan di seluruh AS dan internasional untuk membahas Voice Engine. Pihak-pihak tersebut kini sedang menguji Voice Engine dan setuju untuk tidak meniru identitas orang lain. Mereka juga harus mengungkapkan kepada siapa pun yang mendengarkan audio tersebut bahwa suara tersebut dihasilkan oleh AI. OpenAI juga menambahkan watermarking, sehingga pendengar akan mengetahui bahwa suara tersebut tidak asli.
“Kami percaya bahwa penerapan teknologi suara sintetis secara luas harus disertai dengan pengalaman otentikasi suara yang memverifikasi bahwa pembicara asli dengan sengaja menambahkan suaranya ke layanan dan daftar suara terlarang yang mendeteksi dan mencegah terciptanya suara yang terlalu berlebihan. mirip dengan tokoh terkemuka, kata perusahaan itu.
Ke depan, tidak diketahui apa yang akan terjadi dengan Voice Engine. Meskipun ada kemungkinan bahwa hal ini pada akhirnya akan dipublikasikan, OpenAI juga dapat menentukan bahwa hal tersebut bukan demi kepentingan terbaik publik. Apa pun yang terjadi, kata perusahaan itu, jelas ada kemungkinan untuk berkembang, dan hal itu jelas ada di sini. “Penting bagi orang-orang di seluruh dunia untuk memahami ke mana arah teknologi ini,” kata perusahaan tersebut, “Apakah pada akhirnya kami akan menerapkannya secara luas atau tidak.”