Geekbench merilis aplikasi pengujian benchmark AI
Benchmarking stalwarts Primate Labs pada hari Kamis merilis Geekbench AI 1.0. Aplikasi ini, yang saat ini tersedia untuk Android, Linux, MacOS, dan Windows, menerapkan prinsip-prinsip Geekbench pada machine learning, deep learning, dan beban kerja AI lainnya, dalam upaya untuk memstandardisasi penilaian kinerja di semua platform. Ini merupakan penerus dari Geekbench ML (machine learning), yang diumumkan pada tahun 2021 dan saat ini berada di versi 0.6. "Dalam beberapa tahun terakhir, perusahaan telah bersepakat untuk menggunakan istilah 'AI' dalam jenis beban kerja ini (dan dalam pemasaran terkait mereka)," kata Primate Labs tentang perubahan nama. "Untuk memastikan bahwa semua orang, mulai dari insinyur hingga penggemar kinerja, memahami apa yang dilakukan benchmark ini dan bagaimana cara kerjanya, kami merasa sudah saatnya untuk melakukan pembaruan." Pada awal minggu ini, pembuat ChatGPT OpenAI mengumumkan versi baru dari model benchmark AI miliknya sendiri. SWE-bench Verified adalah penawaran "divalidasi manusia" yang menggunakan validasi manusia untuk menentukan efektivitas model dalam menyelesaikan "masalah dunia nyata."