Setelah acara Pembaruan Musim Semi OpenAI kemarin, Google telah merilis asisten suara yang lebih cerdas untuk bersaing dengan GPT-4o. Gemini Live memanfaatkan model AI canggih untuk memberikan pengalaman percakapan alami secara real-time kepada pengguna seluler.
Juga: Semuanya diumumkan di Google I/O 2024: Gemini, Penelusuran, Android 15, dan banyak lagi
Gemini Live memungkinkan Anda berkomunikasi dengan Gemini dengan cara yang terasa alami dan alami. Misalnya, Anda dapat mengajukan pertanyaan kepada Gemini Live sesuai keinginan Anda dan menyela bot AI di tengah kalimat untuk memperjelas atau mengubah responsnya, mirip dengan apa yang ditunjukkan OpenAI selama GPT-4o-nya. Google akan menawarkan beragam suara untuk dipilih pengguna di Gemini Live, seperti yang dilakukan OpenAI dengan ChatGPT sejak mengintegrasikan Whisper pada September 2023.
Google berencana untuk menambahkan semua pengalaman multimoda ke Gemini Live akhir tahun ini, memungkinkan Gemini melihat dunia di sekitar Anda saat Anda membuka kamera selama percakapan. Hal ini mirip dengan apa yang dapat dilakukan pengguna ChatGPT dalam beberapa minggu mendatang setelah pembaruan yang akan menjadi yang pertama bagi pengguna ChatGPT Plus. Dalam program Gemini, proyek tersebut akan dikelola oleh Project Astra milik Google.
Juga: ChatGPT vs. ChatGPT Plus: Apakah langganan berbayar masih layak dilakukan?
Di antara perubahan ini dan perubahan lainnya, Google juga meningkatkan Gemini Nano untuk mengubah teks, gambar, dan teks, yang berarti modelnya tidak lagi berbasis teks. Gemini Nano dengan Multimodality akan tersedia untuk pertama kalinya untuk ponsel Pixel.