Avatar AI ini kini hadir dengan suara mirip manusia

Salah satu Avatar Suara Synthesia.

Sintesis

Generator video kecerdasan buatan (AI) dan avatar yang mereka buat berkembang pesat dan perusahaan video AI yang berbasis di Inggris, Synthesia, berharap dapat membawa teknologi baru ini ke tingkat berikutnya.

Pada hari Rabu, perusahaan mengumumkan avatar virtualnya, yang dapat menunjukkan emosi masyarakat. Edisi terbaru dari apa yang perusahaan sebut sebagai “aktor digital”, Avatar Ekspresif menampilkan ekspresi wajah yang ekspresif, sinkronisasi bibir yang akurat, dan suara mirip manusia – peningkatan dari nada robotik pada banyak suara AI.

Juga: Zoom mendapatkan desain ulang pertamanya dalam 10 tahun, didukung oleh AI

“Teknologi ini menghadirkan tingkat kecanggihan dan realisme pada avatar digital yang mengaburkan batas antara kenyataan dan kenyataan,” kata perusahaan itu dalam sebuah pengumuman.

Platform teks-ke-video Synthesia hadir dengan lebih dari 160 stok avatar AI yang dapat dipilih, yang dibuat oleh perusahaan berdasarkan aktor, dengan izin dan kompensasi mereka. Tim dapat mengintegrasikan video menyeluruh dan membuat video dalam lebih dari 130 bahasa.

Perusahaan ini ingin merevolusi seluruh proses pembuatan film dan perangkat lunak — tetapi hal itu tidak akan terjadi di Hollywood, kata CEO Victor Riparbelli dalam rilisnya. Sebaliknya, perusahaan berfokus pada bisnis dan B2B, yang memandang perlunya video yang mudah dibuat, menarik, dan ramah pengguna.

Juga: Apa itu AI generatif dan mengapa begitu populer? Inilah semua yang perlu Anda ketahui

Avatar Ekspresif Synthesia didukung oleh model AI Express-1 miliknya. Meskipun perusahaan menggunakan LLM sumber terbuka untuk audio produk, Express-1 dilatih sepenuhnya tentang produk internal — tidak ada yang dibuat atau dihapus dari Internet.

Dalam acara tersebut, Riparbelli menjelaskan bahwa perusahaan mempekerjakan ribuan aktor untuk memfilmkan video model Express-1 di studio mereka di London dan New York, untuk menghindari impor konten dari buku yang sudah ada.

“Dengan teknologi seperti ini, ini bukanlah cara yang baik untuk membuat produk, karena Anda akhirnya meniru produk tersebut, dan itulah yang kami coba hindari,” kata Riparbelli. “Kamu mencoba meniru cara orang berbicara.”

Riparbelli menambahkan bahwa kumpulan data kecil ini sempurna untuk model Express-1 karena “lebih sempit dan lebih spesifik” dibandingkan model seperti Sora atau Runway OpenAI.

Selain itu: VLOGGER AI versi Google dapat membuat avatar video dari foto

Acara tersebut menampilkan avatar yang menunjukkan tiga motivasi: “Saya senang”, “Saya sedih”, dan “Saya sedih”. Avatar berbicara lebih jelas dan alami dibandingkan teknologi Synthesia generasi sebelumnya.

“Avatar Interpretif tidak hanya meniru ucapan orang; mereka memahami apa yang terjadi,” demikian bunyi pengumuman tersebut. “Apakah percakapannya bahagia atau sedih, avatar kita mengubah perilakunya, menunjukkan empati dan pengertian yang sebelumnya hanya tersedia bagi manusia.”

Meskipun hampir tidak dapat dibedakan dari manusia sungguhan, bentuk kehidupan dari avatar-avatar ini bisa berbahaya – terutama karena banyaknya penyalahgunaan teknologi.

“Kami tahu bahwa Avatar Ekspresif adalah teknologi baru yang kuat, dirilis pada tahun yang sangat penting bagi demokrasi, ketika miliaran orang di seluruh dunia menggunakan hak pilih mereka,” kata perusahaan tersebut.

“Kami telah mengambil langkah-langkah untuk mencegah penyalahgunaan platform kami, termasuk merevisi kebijakan kami untuk membatasi jumlah konten yang dapat dibuat oleh orang-orang, berinvestasi dalam mengidentifikasi pelaku kejahatan, menambahkan tim yang bekerja pada keamanan AI, dan bereksperimen dengan teknologi sah seperti C2PA.”

Juga: 80% orang berpendapat bahwa deepfake akan mempengaruhi pemilu. Berikut tiga cara yang bisa Anda persiapkan

Perusahaan juga telah menyiapkan pengamanan sebelum rilis hari Rabu. Pengguna dapat membuat avatar tetapi harus mendapat persetujuan eksplisit dari orang tersebut dan melalui “proses seperti KYC”, menurut situs web Synthesia. Selain itu, Anda dapat memilih keluar dari proses ini kapan saja (seperti yang dilakukan stokis), dan Synthesia akan menghapus data dan fitur Anda. Perusahaan tidak mengizinkan pengguna membuat avatar selebriti atau politisi dalam kondisi apa pun.

Selain itu, Riparbelli menjelaskan dalam video tersebut bahwa alat Synthesia dapat digunakan untuk membuat organisasi berita dan media untuk tujuan bisnis. Namun, tidak jelas metode mana yang digunakan Synthesia, dan apakah perusahaan memantau konten platformnya.

Synthesia juga merupakan bagian dari Inisiatif Keaslian Konten, sebuah kolaborasi perusahaan dan organisasi yang mengerjakan alat untuk menemukan konten atau mengidentifikasi sumbernya.

Juga: Apa Gejala Internalnya? Itu sebabnya Adobe AI baru menjaga metadata ini tetap terdepan

Synthesia percaya bahwa Avatar Ekspresif akan membantu bisnis melampaui apa yang mereka perlukan untuk membuat video tentang empati: video dengan topik kompleks seperti layanan kesehatan, atau produk layanan pelanggan yang meniru keramahan dan kesabaran orang sungguhan.

“Ini adalah rilis pertama, hal pertama, bisa dibilang, yang kami lakukan pada model-model ini,” kata Riparbelli selama pertunjukan. “Saya pikir kita akan melihat banyak perubahan dalam enam hingga sembilan bulan ke depan.”

Baca juga:  OpenAI mengungkapkan versi GPT-4o yang baru dan lebih baik - tetapi Anda tidak dapat menjelaskan mengapa versi ini lebih baik

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *