Waktu Keuangan diumumkan kesepakatan dengan OpenAI pada hari Senin untuk melisensikan jurnalisme kelas dunia untuk pelatihan dan informasi model ChatGPT. Ia bergabung dengan Axel Springer dan Associated Press yang mencapai kesepakatan serupa, di mana OpenAI kabarnya menawarkan jutaan untuk hak menggunakan konten. Namun, ChatGPT dilatih pada banyak konten hasil web lainnya yang tidak dibayar oleh OpenAI. Jadi mengapa OpenAI membayar untuk beberapa kumpulan data dan bukan kumpulan data lainnya?

Kesepakatan lisensi OpenAI tampaknya mengirimkan pesan yang jelas: kami akan tetap menggunakan konten Anda, jadi tandatangani kesepakatan dengan kami atau Anda akan ketinggalan. Keuntungan utama dari kesepakatan lisensi tampaknya menjadi hal yang menonjol dalam jawaban ChatGPT. Beberapa penerbit mungkin juga ingin memperkuat hubungan dengan saluran distribusi informasi besar berikutnya sebelum saluran tersebut mengambil alih. Namun, tampaknya OpenAI menggunakan banyak konten penerbit.

OpenAI telah melatih model AI-nya sebagian pada “data yang tersedia untuk umum” menurut CTO Mira Murati, yang sengaja dibuat tidak jelas. Apa saja data yang tersedia untuk umum? Ungkapan tersebut mengasumsikan segala sesuatu yang gratis untuk dibaca di internet juga bebas untuk dimasukkan ke dalam ChatGPT. Misalnya, Gizmodo adalah bagian dari “data yang tersedia untuk umum” OpenAI. Situs web kami telah di-cache 34.000 kali di WebText GPT-2 kumpulan data, kumpulan data terakhir yang diungkapkan OpenAI untuk melatih model AI.

Gizmodo gratis untuk pembaca sebagian besar karena iklan di halaman web ini. Jika pembaca dapat mengakses konten kami melalui ChatGPT, itu merusak model bisnis kami. The New York Times, yang lebih banyak digunakan dalam kumpulan data WebText GPT-2, menggugat OpenAI atas pelanggaran hak cipta atas masalah ini.

Kesepakatan lisensi konten dengan OpenAI sepertinya merupakan satu-satunya cara bagi penerbit untuk tetap relevan di era AI. Di sebuah jumpa persCEO Financial Times Group John Ridding mengatakan kesepakatan ini “akan memperluas jangkauan” pekerjaan mereka sekaligus menawarkan “wawasan awal tentang bagaimana konten muncul melalui AI.”

“Masalahnya tentang AI bukanlah kecerdasan buatan,” kata Matthew Butterick, pengacara yang mewakili Sarah Silverman dan penulis buku lain yang menggugat OpenAI, dalam sebuah wawancara dengan Gizmodo. “Ini adalah kecerdasan manusia yang diambil dari satu tempat, dipisahkan dari penciptanya, lalu perusahaan teknologi besar ini memberi label harga pada kecerdasan tersebut dan menjualnya kepada orang lain.”

Butterick adalah penggugat dalam enam tuntutan hukum hak cipta terhadap perusahaan AI. Dia juga seorang penulis, pembuat kode, dan desainer, jadi dia memahami bagaimana AI dapat mengancam industri-industri ini. Secara umum, kasusnya berpusat pada klaim bahwa AI secara bersamaan menggunakan karya pencipta dan mengancam penghidupan mereka.

Kesepakatan lisensi OpenAI membuat orang terkejut dengan konten yang digunakan ChatGPT secara gratis. Perusahaan teknologi berpendapat bahwa AI generatif adalah “penggunaan wajar” atas karya berhak cipta karena AI tersebut mengubahnya menjadi sesuatu yang baru. Dunia AI juga berpendapat bahwa mereka menggunakan model yang mirip dengan Google Penelusuran, yang menyimpan konten berhak cipta dalam cache untuk menciptakan alat pencarian informasi yang berguna. Mirip dengan Google, chatbot AI baru-baru ini mulai menyertakan hyperlink. Pada akhirnya, pengadilan harus memutuskan apakah AI generatif merupakan “penggunaan wajar”.

OpenAI tidak segera menanggapi permintaan komentar Gizmodo.

Penulis dan penerbit buku bukan satu-satunya yang tampaknya mengambil konten dari OpenAI. The New York Times baru-baru ini melaporkan bahwa OpenAI melatih GPT-4 secara menyeluruh satu juta jam transkripsi video YouTube. Beberapa hari sebelum laporan tersebut keluar, CEO YouTube mengatakan penggunaan videonya untuk pelatihan AI merupakan “pelanggaran nyata” terhadap kebijakannya.

Kesepakatan lisensi konten OpenAI memperkeruh suasana diskusi. Perusahaan ini menggunakan konten internet secara gratis, dan juga membayar orang lain untuk pekerjaan mereka. Perusahaan teknologi lain, seperti Apple, dilaporkan lebih proaktif dalam membayar semua data pelatihan mereka. Adobe dilaporkan membayar $3 per menit video untuk melatih generator video AI-nya.

Namun, tidak jelas apakah pembayaran satu kali saja untuk memperoleh data pelatihan AI sudah cukup. Kita berbicara tentang alat yang berpotensi membalikkan industri media bagi penulis, produser audio dan video, dan banyak lagi. Menandatangani kesepakatan dengan OpenAI dapat menjamin Anda mendapatkan tempat yang bagus di hasil ChatGPT, namun sepertinya chatbot AI mungkin tetap menggunakan konten Anda. Setidaknya untuk saat ini, perusahaan AI tertarik untuk menggunakan segala sesuatu di internet dan mempertanyakan legalitas semuanya nanti.

Fuente