Samsung Luncurkan TRUEBench, Benchmark Khusus Model AI

Author
Irham
Reading time:
September 29, 2025

Samsung baru saja mengumumkan aplikasi benchmark buatan mereka sendiri yaitu TRUEBench. Aplikasi benchmark ini dirancang khusus untuk mengukur kecerdasan buatan alias AI, sejauh mana bisa membantu produktivitas di dunia kerja nyata. Benchmark ini dikembangkan langsung oleh Samsung Research, dimana benchmark ini dirancang untuk menilai performa large language models (LLM) dalam menyelesaikan tugas sehari-hari di lingkungan profesional.

Benchmark AI Samsung TrueBench

Keunggulan Benchmark TRUEBench

Berbeda dari benchmark yang sudah ada, TRUEBench menawarkan cakupan yang lebih luas. Ada 10 kategori dengan 46 sub-kategori yang digunakan sebagai tolok ukur, mencakup berbagai kebutuhan seperti pembuatan konten, analisis data, ringkasan, hingga terjemahan. Totalnya, Samsung menyiapkan 2.485 set pengujian yang tidak hanya menggunakan bahasa Inggris, tapi juga 12 bahasa lain termasuk Korea, Jepang, Mandarin, Spanyol, hingga Vietnam.

Skala pengujiannya pun cukup realistis. Mulai dari permintaan singkat sepanjang 8 karakter, sampai ringkasan dokumen dengan panjang lebih dari 20.000 karakter. Semua ini dirancang untuk menggambarkan tantangan nyata di dunia kerja.

Baca Juga: Samsung Odyssey OLED G5 G50SF Resmi Hadir di Indonesia • Jagat Review

Benchmark AI Samsung TrueBench

TRUEBench tidak memberikan penilaian sekadar benar atau salahnya jawaban AI. Benchmark ini juga menghitung faktor kebutuhan implisit pengguna yang sering kali tidak tertulis secara langsung. Untuk memastikan hasil lebih objektif, evaluasi tidak hanya dibuat pakai mesin, tapi juga kolaborasi dari manusia dan AI, lalu disempurnakan secara berulang. Berikutnya, evaluasi bakal dilakukan secara otomatis menggunakan patokan yang sudah dibuat sebagai standar ini, sehingga hasilnya diharapkan bisa konsisten dan minim bias.

Buat para peneliti dan juga pengembang, Samsung juga membuka akses ke data sampel dan leaderboard TRUEBench di platform Hugging Face. Pengguna bisa membandingkan performa hingga lima model AI sekaligus, termasuk melihat data tambahan seperti panjang rata-rata jawaban untuk mengukur efisiensi.

Tapi, perlu digaris bawahi, benchmark ini hanya digunakan untuk menguji kemampuan sebuah model LLM, bukan untuk menguji performa sistem atau perangkat keras dalam memproses AI.

Sumber

Share
Load Comments

Gadget

October 19, 2025 - 0

Review Infinix GT 30: Smartphone Gaming Padahal Aslinya All-Rounder!

Ini adalah Infinix GT 30! Ya, hape ini adalah versi…
July 10, 2025 - 0

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Fossil mengumumkan hadrinya dua jam tangan eksklusif hasil kolaborasi Marvel…
June 18, 2025 - 0

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Ini hape yang memicu Pro-kontra.  Banyak orang, bahkan kami pun…
June 17, 2025 - 0

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Kalian sedang cari smartwatch bentuk kotak yang canggih, baterai irit,…

Laptop

February 6, 2026 - 0

Review Acer Nitro V 16S AI: Gaming Kenceng, Nyari Duit Kenceng, Harga Lebih Terjangkau!

Ini adalah Laptop High Performance terbaru dari Acer, yang tak…
February 5, 2026 - 0

Review ASUS ExpertBook P3 Setelah 100 Hari: Tetap “Gres” Seperti Baru?

Laptop Bisnis ini tidak rusak meskipun diinjak, disiram, ataupun dijatuhkan.…
January 22, 2026 - 0

Mengenal Seri Laptop HP OmniBook: Apa itu OmniBook? Kemana Spectre, Envy dan Pavilion?

Laptop-laptop yang akan kami bahas kali ini adalah laptop thin…

Gaming

February 5, 2026 - 0

Kenaikan Harga Switch 2 Jadi Pertimbangan Nintendo

Nintendo akan pertimbangkan dengan matang sebelum menaikkan harga Switch 2…
February 5, 2026 - 0

Perusahaan Game Jepang Alami Penurunan Nilai Saham Massal

Pasar gaming Jepang ternyata ikut terdampak oleh penurunan nilai saham…
February 5, 2026 - 0

GTA 5 Telah Terjual Sebanyak 225 Juta Copy Hingga Saat Ini

Minat gamer akan GTA 5 ternyata masih belum padam, terbukti…
February 5, 2026 - 0

Electronic Arts Nikmati Peningkatan Keuntungan Berkat Battlefield 6

Kesuksesan penjualan Battlefield 6 menjadi pendorong keuntungan besar untuk Electronic…