Grok mendapat peningkatan yang mengesankan – dan tentu saja peningkatan grafis AI

Contoh grok

Gambar SOPA / Kontributor / Getty Images

Elon Musk adalah investor di OpenAI ketika perusahaan tersebut didirikan pada tahun 2015, namun dia tidak hanya mengundurkan diri dari perusahaan tersebut tetapi juga mengkritik pendekatannya terhadap kebenaran dan keamanan politik. Hasilnya, Musk meluncurkan chatbot AI-nya, Grok, yang mendapat dorongan besar.

Selain itu: Nvidia akan melatih 100.000 penduduk California tentang AI dalam kemitraan yang pertama kali dilakukan.

Pada hari Selasa, xAI, perusahaan AI yang didirikan oleh Musk, mengumumkan peluncuran prototipe pertama Grok-2, model bahasa skala besar (LLM) dengan obrolan, pengkodean, dan penalaran tingkat lanjut. Rilisan ini juga menyertakan Grok-2 mini, yang sesuai dengan namanya merupakan versi lebih ringan dari Grok-2.

Sebelumnya, versi awal Grok-2 telah diuji di Chatbot Arena Large Model Systems Organization (LMSYS) dengan nama anonim “sus-column-r”, sebuah praktik yang dilakukan banyak perusahaan AI sebelum meluncurkan versi baru.

Pada platform crowdfunding ini, pengguna dapat mengevaluasi LLM dengan berinteraksi dengan dua model secara berdampingan dan membandingkan jawaban mereka tanpa mengetahui nama modelnya, sehingga hasilnya menunjukkan bahwa mereka memiliki keterampilan. Saat diadu dengan model industri terkemuka seperti GPT-4o OpenAI dan Gemini 1.5 Pro dari Google, Grok-2 berhasil mempertahankan keunggulannya, menempati posisi ketiga dalam kategori “Keseluruhan” dan setara dengan GPT-4o, seperti terlihat di bawah.

Jika Anda, seperti saya, mengunjungi papan peringkat Chatbot Arena dan terkejut karena Anda tidak melihat hasil yang sama, LMSYS mengungkapkan bahwa mereka memposting hasil pertama di Twitter (X), dengan “Pembaruan resmi untuk Grok 2 segera hadir..! “

Selain itu: Ancaman AI ada di mana-mana – dan sekarang MIT menambahkan semuanya ke dalam satu database

Hasil Chatbot Arena penting lainnya termasuk kinerja Grok-2 dalam kategori matematika dan menulis, di mana ia menempati posisi kedua di keduanya, dan Hard Prompts, di mana ia menempati posisi keempat. Jika Anda ingin mencoba Arena, buka situsnya, klik Arena berdampingan, dan masukkan sampelnya.

Perusahaan juga mengevaluasi kinerja Grok-2 pada tolok ukur LLM yang populer, termasuk tolok ukur Massive Multitask Language Understanding (MMLU) dan MATH. Hasilnya lebih baik dibandingkan pendahulunya, Grok 1.5, dan menyaingi model terkemuka di industri, termasuk GPT-4o, Claude 3 Opus, Llama 3, dan banyak lagi.

papan skor sesuai dengan skor Elo-nya

xAI

Selain suaranya yang berkualitas tinggi, Grok 2 memungkinkan pengguna membuat gambar berkualitas tinggi bersama dengan model pemrosesan gambar FLUX.1 Black Forest Labs.

Meskipun banyak pembuat foto di pasar memiliki batasan dalam mengambil gambar dengan orang-orang terkenal seperti selebriti dan politisi, Grok-2 tidak melakukannya, karena banyak penguji beta telah masuk ke platform tersebut, membuat gambar politisi dalam situasi yang menarik. Di bawah ini, saya menyertakan salah satu generasi yang lebih kecil.

Gambar yang disajikan berkualitas tinggi dan nyata, namun tampaknya tidak ada pengungkapan di platform yang secara jelas menunjukkan bahwa gambar tersebut dibuat, metode lain yang diambil banyak platform sosial untuk melindungi keselamatan pengguna.

Selain itu: Grafik Piksel baru dari Google mungkin yang membuat saya tertarik pada AI

Grok-2 dan Grok-2 mini dirilis dalam versi beta untuk pengguna X hingga X Premium dan Premium+. Paket X premium ini masing-masing berharga $8 dan $16 per bulan, dan mencakup fitur seperti cetak biru, sedikit atau tanpa iklan, pengaturan prioritas, verifikasi ID, dan banyak lagi. Kedua model tersebut akan dirilis ke pengembang melalui platform API baru akhir bulan ini.

Baca juga:  Bagaimana Red Hat memanfaatkan AI untuk membuat hidup sysadmin lebih mudah

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *