Pada acara I/O tahunan yang sangat dinanti-nantikan, Google minggu ini mengumumkan fitur-fitur baru yang menarik pada model AI Gemini, khususnya kemampuan multi-mode, dalam presentasi yang telah direkam sebelumnya.

Meskipun terdengar seperti fitur “Live” di Instagram atau TikTok, Live for Gemini berarti kemampuan untuk “menunjukkan” pemikiran Anda kepada Gemini melalui kamera, dan melakukan percakapan dua arah dengan AI secara real time. Anggap saja sebagai panggilan video dengan teman Anda yang mengetahui segalanya.

Juga: Saya mengunduh Project Astra dari Google dan sepertinya itu adalah keluaran AI di masa depan (sampai saat itu belum ada).

Tahun ini teknologi AI jenis ini telah muncul di banyak perangkat lain seperti Rabbit R1 dan pin Humane AI, dua perangkat non-seluler yang keluar tahun ini dengan banyak peminat, namun pada akhirnya tidak beranjak. jauh dari kehebatan smartphone.

Kini setelah perangkat-perangkat ini mulai populer, AI Gemini dari Google telah mengambil alih panggung dengan AI-nya yang cepat dan dapat berbicara banyak dan telah membawa kembali perhatian ke ponsel pintar.

Google menertawakan hal ini sehari sebelum I/O dalam tweet yang menunjukkan Gemini dengan baik menunjukkan panggung di I/O, memberikan informasi tambahan tentang acara tersebut dan menanyakan pertanyaan lanjutan kepada pengguna.

Dalam video demonstrasi di I/O, pengguna menyalakan kamera ponsel cerdas dan menjelajahi ruangan, meminta Gemini untuk mengidentifikasi area sekitar dan memberikan apa yang dilihatnya. Yang paling mengesankan bukan hanya jawaban yang diberikan Gemini, namun seberapa cepat jawaban tercipta, yang mengarah pada hubungan alami, percakapan yang coba disampaikan oleh Google.

Juga: Tiga produk Gemini Advanced baru terungkap di Google I/O 2024

Proyek Google yang disebut Project Astra berfokus pada menghadirkan teknologi AI canggih ke tingkat ponsel pintar; Itu sebabnya, kata Google, mereka membangun Gemini dengan kemampuan multitasking sejak awal. Namun membuat AI menjawab dan mengajukan pertanyaan lanjutan secara real time jelas merupakan tantangan besar.

Pada acara R1 di bulan April, Rabbit memamerkan teknologi simulasi AI serupa yang banyak dipuji sebagai fitur menarik. Video gameplay Google menegaskan bahwa perusahaan telah bekerja keras untuk mengembangkan fungsionalitas Gemini yang, tampaknya, bisa menjadi lebih baik lagi.

Rabbit R1 juga dilengkapi AI multimodal, dengan kamera internal dalam bentuk persegi.

Kerry Wan/ZDNET

Google bukan satu-satunya yang memiliki banyak sistem AI. Sehari sebelumnya, OpenAI memamerkan pembaruannya selama siaran langsung Pembaruan Musim Semi OpenAI, termasuk GPT-4o, versi AI terbaru yang kini mendukung ChatGPT untuk “melihat, mendengar, dan berbicara”. Selama demonstrasi, presenter menunjukkan berbagai objek dan aktivitas AI melalui kamera ponselnya, termasuk soal matematika tulisan tangan, dan ekspresi wajah presenter, dimana AI mengenali objek tersebut melalui komunikasi bolak-balik dengan fitur-fiturnya. pengguna.

Juga: AI ‘Tanya Foto’ Google yang baru memecahkan masalah yang saya hadapi setiap hari

Ketika Google menggantikan Gemini di ponsel akhir tahun ini dengan ini, teknologi perusahaan dapat menjadi yang terdepan dalam perlombaan asisten AI, terutama dengan pertanyaan Gemini yang jelas dan intuitif. Namun, besaran sebenarnya dari kekuatan tersebut belum sepenuhnya terealisasi; perkembangan ini menempatkan Gemini sebagai asisten AI multi-sisi terbaik.

Peserta di acara I/O Google berkesempatan untuk melihat pratinjau AI Gemini dalam mode “sandbox” yang terkontrol di acara tersebut, namun kita bisa mengharapkan lebih banyak pengalaman praktis di akhir tahun ini.

Post Views: 36

Baca Juga

Rekomendasi untuk kamu