Pada acara I/O tahunan yang sangat dinantikan, Google mengumumkan fitur-fitur baru yang menarik pada model AI Gemini, khususnya kemampuan multi-mode, dalam presentasi yang telah direkam sebelumnya.
Meskipun terdengar seperti fitur “Live” di Instagram atau TikTok, Live for Gemini berarti kemampuan untuk “menunjukkan” pemikiran Anda kepada Gemini melalui kamera, dan melakukan percakapan dua arah dengan AI secara real time. Bayangkan FaceTiming sebagai teman Anda yang mengetahui segalanya tentang segala hal.
Juga: Semuanya diumumkan di Google I/O 2024: Gemini, Search, Project Astra, dan banyak lagi
Tahun ini teknologi AI jenis ini telah muncul di banyak perangkat lain seperti Rabbit R1 dan pin Humane AI, dua perangkat non-seluler yang keluar tahun ini dengan banyak peminat, namun pada akhirnya tidak beranjak. jauh dari kehebatan smartphone.
Kini setelah perangkat-perangkat ini menikmati masa kejayaannya, AI Gemini dari Google telah mengambil alih panggung dengan AI percakapannya yang cepat dan multi-segi dan menghidupkan kembali ponsel pintar.
Google menertawakan hal ini sehari sebelum I/O dalam tweet yang menunjukkan Gemini menunjukkan panggung di I/O, memberikan informasi tambahan tentang acara tersebut dan menanyakan pertanyaan lanjutan kepada pengguna.
Dalam video demonstrasi di I/O, pengguna menyalakan kamera ponsel cerdas dan menjelajahi ruangan, meminta Gemini untuk mengidentifikasi area sekitar dan memberikan apa yang dilihatnya. Yang paling mengesankan bukan hanya jawaban yang diberikan Gemini, namun seberapa cepat jawaban tercipta, yang mengarah pada hubungan alami, percakapan yang coba disampaikan oleh Google.
Juga: Tiga produk Gemini Advanced baru terungkap di Google I/O 2024
Proyek Google yang disebut Project Astra berfokus pada menghadirkan teknologi AI modern ke tingkat ponsel pintar; Itu sebabnya, kata Google, mereka membangun Gemini dengan kemampuan multitasking sejak awal. Namun membuat AI menjawab dan mengajukan pertanyaan lanjutan secara real time jelas merupakan tantangan besar.
Pada acara R1 di bulan April, Rabbit memamerkan teknologi simulasi AI serupa yang banyak dipuji sebagai fitur menarik. Video gameplay Google menegaskan bahwa perusahaan telah bekerja keras untuk mengembangkan fungsionalitas Gemini yang, tampaknya, bisa menjadi lebih baik lagi.
Juga: Apa itu Gemini Langsung? Pertama lihat bot AI suara real-time baru Google
Google bukan satu-satunya yang memiliki banyak sistem AI. Sehari sebelumnya, OpenAI memamerkan pembaruannya selama siaran langsung Pembaruan Musim Semi OpenAI, termasuk GPT-4o, versi AI terbaru yang kini mendukung ChatGPT untuk “melihat, mendengar, dan berbicara”. Selama demonstrasi, presenter menunjukkan kepada AI berbagai objek dan peristiwa melalui kamera ponselnya, termasuk soal matematika tulisan tangan, dan ekspresi wajah presenter, dimana AI mengenali objek tersebut melalui simulasi komunikasi dengan penggunanya.
Juga: AI ‘Tanya Foto’ Google yang baru memecahkan masalah yang saya hadapi setiap hari
Ketika Google menggantikan Gemini di ponsel akhir tahun ini dengan ini, teknologi perusahaan dapat menjadi yang terdepan dalam perlombaan asisten AI, terutama dengan pertanyaan Gemini yang jelas dan intuitif. Meskipun cakupan potensinya belum jelas, perkembangan ini menempatkan Gemini sebagai salah satu jenis dukungan AI yang paling terintegrasi.
Para peserta acara I/O Google berkesempatan untuk melihat pratinjau ponsel “sandbox” bertenaga AI milik Gemini di acara tersebut, namun kita bisa mengharapkan lebih banyak pengalaman langsung di akhir tahun ini.