Samsung Luncurkan TRUEBench, Benchmark Khusus Model AI

Author
Irham
Reading time:
September 29, 2025

Samsung baru saja mengumumkan aplikasi benchmark buatan mereka sendiri yaitu TRUEBench. Aplikasi benchmark ini dirancang khusus untuk mengukur kecerdasan buatan alias AI, sejauh mana bisa membantu produktivitas di dunia kerja nyata. Benchmark ini dikembangkan langsung oleh Samsung Research, dimana benchmark ini dirancang untuk menilai performa large language models (LLM) dalam menyelesaikan tugas sehari-hari di lingkungan profesional.

Benchmark AI Samsung TrueBench

Keunggulan Benchmark TRUEBench

Berbeda dari benchmark yang sudah ada, TRUEBench menawarkan cakupan yang lebih luas. Ada 10 kategori dengan 46 sub-kategori yang digunakan sebagai tolok ukur, mencakup berbagai kebutuhan seperti pembuatan konten, analisis data, ringkasan, hingga terjemahan. Totalnya, Samsung menyiapkan 2.485 set pengujian yang tidak hanya menggunakan bahasa Inggris, tapi juga 12 bahasa lain termasuk Korea, Jepang, Mandarin, Spanyol, hingga Vietnam.

Skala pengujiannya pun cukup realistis. Mulai dari permintaan singkat sepanjang 8 karakter, sampai ringkasan dokumen dengan panjang lebih dari 20.000 karakter. Semua ini dirancang untuk menggambarkan tantangan nyata di dunia kerja.

Baca Juga: Samsung Odyssey OLED G5 G50SF Resmi Hadir di Indonesia • Jagat Review

Benchmark AI Samsung TrueBench

TRUEBench tidak memberikan penilaian sekadar benar atau salahnya jawaban AI. Benchmark ini juga menghitung faktor kebutuhan implisit pengguna yang sering kali tidak tertulis secara langsung. Untuk memastikan hasil lebih objektif, evaluasi tidak hanya dibuat pakai mesin, tapi juga kolaborasi dari manusia dan AI, lalu disempurnakan secara berulang. Berikutnya, evaluasi bakal dilakukan secara otomatis menggunakan patokan yang sudah dibuat sebagai standar ini, sehingga hasilnya diharapkan bisa konsisten dan minim bias.

Buat para peneliti dan juga pengembang, Samsung juga membuka akses ke data sampel dan leaderboard TRUEBench di platform Hugging Face. Pengguna bisa membandingkan performa hingga lima model AI sekaligus, termasuk melihat data tambahan seperti panjang rata-rata jawaban untuk mengukur efisiensi.

Tapi, perlu digaris bawahi, benchmark ini hanya digunakan untuk menguji kemampuan sebuah model LLM, bukan untuk menguji performa sistem atau perangkat keras dalam memproses AI.

Sumber

Share
Load Comments

Gadget

October 19, 2025 - 0

Review Infinix GT 30: Smartphone Gaming Padahal Aslinya All-Rounder!

Ini adalah Infinix GT 30! Ya, hape ini adalah versi…
July 10, 2025 - 0

Fossil Hadirkan Dua Jam Tangan Kolaborasi Marvel Fantastic Four

Fossil mengumumkan hadrinya dua jam tangan eksklusif hasil kolaborasi Marvel…
June 18, 2025 - 0

Review “Singkat” Samsung Galaxy S25 Edge: Smartphone Pemicu Pro-Kontra! Sebaik/Seburuk Itu?

Ini hape yang memicu Pro-kontra.  Banyak orang, bahkan kami pun…
June 17, 2025 - 0

Review Amazfit Active 2 Square: Smartwatch “Kotak” yang Klasik, Canggih, dan Baterai Awet!

Kalian sedang cari smartwatch bentuk kotak yang canggih, baterai irit,…

Laptop

December 11, 2025 - 0

Review Infinix XBOOK B14: Harga Terjangkau, Performa Mumpuni, Cocok Buat Sekolah, Kuliah dan Kerja

Ini adalah laptop terbaru dari Infinix, yang bukan hanya terjangkau,…
December 6, 2025 - 0

Seri Mengenal Laptop Gaming Part 6 feat. HP: Main Game Lebih Kencang dengan AI!

AI yang satu ini mungkin akan kalian sukai. Tenang, AI…
December 3, 2025 - 0

Review Acer Predator Triton 14 AI: Performa Super Kencang, Suhu Tetap Adem, Bobot 1.5 KG!

Ini adalah laptop gaming dan content creation terbaru dari Acer…
December 2, 2025 - 0

Mana yg Lebih Kencang? Dual Channel 12 GB atau 16 GB? feat. ASUS Vivobook 14 A1404

“Harga RAM lagi naik.” “Tapi Laptop butuh Upgrade.” “Enaknya Upgrade…

Gaming

December 12, 2025 - 0

The Game Awards 2025 Tampilkan 50 Trailer Game & Film Adaptasi Game

Bukan hanya sekedar ajang penghargaan game, The Game Awards 2025…
December 12, 2025 - 0

Clair Obscur: Expedition 33 Menangkan 9 Awards di The Game Awards 2025

Clair Obscur: Expedition 33 mendominasi penghargaan di The Game Awards…
December 12, 2025 - 0

Developer Codex Mortis Akui Gamenya 100% Dibuat Oleh AI

Ketika game lain berusaha tutupi keterlibatan AI dalam pembuatannya, Codex…
December 12, 2025 - 0

Nintendo Alami Kerugian Besar Akibat Kelangkaan Chip

Semakin melonjaknya harga komponen komputer, terutama Memory RAM sebabkan kerugian…