NVIDIA “Sapu Bersih” Benchmark MLPerf Training v5.1

Author

Irham

Reading time:

News

November 13, 2025

readmode

NVIDIA baru saja memamerkan pencapaiannya dalam hal komputasi AI, lewat hasil terbaru dari MLPerf Training v5.1. Dalam pengujian benchmark industri untuk pelatihan model AI itu, NVIDIA berhasil menyabet posisi tertinggi di semua kategori,mulai dari large language model (LLM), image generation, hingga graph neural network.

Menariknya, NVIDIA juga menjadi satu-satunya platform yang ikut di seluruh tes. Ini secara tak langsung memperlihatkan, kalau ekosistem GPU serta software CUDA yang mereka bangun selama ini sudah benar-benar matang dan fleksibel.

Sistem Rack-Scale Terbaru NVIDIA GB300 NVL72

Pengujian ini juga jadi debut dari GB300 NVL72, sistem rack-scale berbasis arsitektur NVIDIA Blackwell Ultra GPU. Sistem ini mencatat peningkatan kinerja signifikan dibanding generasi sebelumnya, dengan pelatihan Llama 3.1 405B empat kali lebih cepat dan fine-tuning Llama 2 70B LoRA hampir lima kali lebih cepat, semuanya dengan jumlah GPU yang sama.

Kombinasi arsitektur baru dan sumber daya besar yang ditawarkan Blackwell Ultra membawa peningkatan yang signifikan. GPU ini membawa Tensor Core baru dengan 15 petaflops NVFP4 AI compute, dua kali kapasitas perhitungan di attention layer, serta 279GB memori HBM3e. Selain itu, NVIDIA juga memperkenalkan metode pelatihan baru yang mampu memanfaatkan penuh potensi komputasi NVFP4.

Baca Juga: Acerpure Nitro Z Dirilis, TV 4K QLED 100 Inci dengan Refresh Rate 144 Hz • Jagat Review

Sementara di sisi konektivitas, sistem ini terhubung lewat NVIDIA Quantum-X800 InfiniBand, platform jaringan end-to-end 800 Gb/s pertama di industri yang menggandakan bandwidth dibanding generasi sebelumnya.

Capaian NVIDIA di Benchmark MLPerf Training v5.1

Pencapai besar NVIDIA di MLPerf tahun ini salah satunya berkat penggunaan NVFP4 precision, format FP4 buatan NVIDIA yang untuk pertama kalinya digunakan dalam sejarah benchmark tersebut. Format ini memungkinkan peningkatan kecepatan komputasi hingga tiga kali lipat dari FP8 tanpa mengorbankan akurasi hasil pelatihan.

NVIDIA berhasil mencetak waktu pelatihan Llama 3.1 405B, hanya dalam waktu 10 menit Ini dilakukan dengan lebih dari 5.000 GPU Blackwell bekerja serempak. Angka ini 2,7 kali lebih cepat dibanding rekor sebelumnya, sekaligus menunjukkan efisiensi luar biasa di tiap GPU yang digunakan.

Tak berhenti di situ, NVIDIA juga mencatatkan hasil luar biasa di dua benchmark baru yaitu Llama 3.1 8B, yang kini menggantikan BERT-large, dan FLUX.1, model image generation terbaru. Keduanya mencatat waktu pelatihan tercepat, yaitu masing-masing 5,2 menit dengan 512 GPU dan 12,5 menit dengan 1.152 GPU, dengan FLUX.1 menjadi satu-satunya hasil yang dikirimkan di kategori tersebut.

Pengujian benchmarkMLPerf v5.1 juga melibatkan ekosistem luas berisi 15 mitra, termasuk Dell, Lenovo, HPE, Supermicro, dan University of Florida, yang ikut mengirimkan hasil berbasis platform NVIDIA.

Melihat hasil ini, tentunya menjadi pemacu bagi para rival untuk bisa melampaui rekor-rekor yang dicapai oleh NVIDIA. Dan cukup menarik, bagaimana perkembangan industri AI di waktu kedepan, dengan kekuatan komputasi AI dari NVIDIA yang makin powerful ini.