NVIDIA Rilis Nemotron 3, Model AI Open Source untuk Multi-Agen

Rita Puspita Sari
•
1 hari yang lalu

NVIDIA kembali menegaskan posisinya sebagai pemimpin inovasi Artificial Intelligence (AI) global dengan meluncurkan NVIDIA Nemotron™ 3, sebuah keluarga model AI terbuka yang dirancang khusus untuk mendukung pengembangan AI agentic—yakni sistem AI yang mampu bekerja secara kolaboratif, otonom, dan terkoordinasi dalam menyelesaikan tugas kompleks. Peluncuran ini bukan sekadar penambahan portofolio model AI, melainkan langkah strategis NVIDIA dalam mendorong ekosistem AI yang lebih transparan, efisien, dan dapat disesuaikan dengan kebutuhan berbagai industri.

Berbeda dengan pendekatan AI konvensional yang mengandalkan satu model besar, Nemotron 3 hadir sebagai fondasi bagi sistem multi-agen, di mana banyak agen AI dapat saling berinteraksi, berbagi konteks, dan bekerja sama untuk mencapai tujuan yang sama. Konsep ini dinilai semakin relevan seiring meningkatnya kebutuhan otomatisasi alur kerja yang kompleks, mulai dari manufaktur, keamanan siber, hingga pengembangan perangkat lunak dan layanan digital.

Menjawab Tantangan AI Multi-Agen Modern

Dalam beberapa tahun terakhir, organisasi mulai beralih dari chatbot berbasis satu model menuju sistem AI yang lebih canggih dan kolaboratif. Namun, transisi ini tidak lepas dari tantangan. Pengembang kerap menghadapi masalah seperti beban komunikasi antar agen, pergeseran konteks (context drift), serta biaya inferensi yang tinggi ketika model harus memproses data dan penalaran dalam skala besar.

Selain itu, kepercayaan terhadap AI menjadi isu krusial. Model yang digunakan untuk mengotomatiskan keputusan penting harus dapat dipahami cara kerjanya, transparan dalam proses pengambilan keputusan, serta dapat diaudit. Di sinilah Nemotron 3 memainkan peran penting. Dengan mengusung pendekatan model terbuka (open models), NVIDIA memberikan keleluasaan bagi pengembang dan organisasi untuk memahami, menyesuaikan, dan mengontrol AI sesuai kebutuhan mereka.

Jensen Huang, pendiri sekaligus CEO NVIDIA, menegaskan bahwa keterbukaan adalah kunci kemajuan AI. Menurutnya, Nemotron dirancang sebagai platform terbuka yang memungkinkan AI canggih diakses secara lebih luas, tanpa mengorbankan efisiensi dan skalabilitas. Pendekatan ini sekaligus mempercepat adopsi AI agentic di berbagai sektor.

Arsitektur Hybrid MoE, Kunci Efisiensi Nemotron 3

Salah satu keunggulan utama Nemotron 3 terletak pada arsitekturnya yang inovatif, yakni hybrid latent mixture-of-experts (MoE). Berbeda dengan model monolitik yang selalu mengaktifkan seluruh parameter saat memproses permintaan, MoE hanya mengaktifkan sebagian “pakar” atau parameter yang relevan dengan tugas tertentu.

Pendekatan ini memberikan dua keuntungan besar. Pertama, efisiensi komputasi meningkat drastis karena sumber daya hanya digunakan saat dibutuhkan. Kedua, biaya operasional menjadi lebih rendah, terutama untuk inferensi skala besar yang melibatkan banyak agen AI secara simultan. Dengan arsitektur ini, Nemotron 3 dirancang untuk berjalan optimal di lingkungan produksi, bukan sekadar unggul dalam pengujian laboratorium.

Tiga Varian Nemotron 3 untuk Beragam Kebutuhan

NVIDIA menghadirkan Nemotron 3 dalam tiga ukuran utama yang dapat disesuaikan dengan kebutuhan pengguna:

Nemotron 3 Nano
Model ini memiliki sekitar 30 miliar parameter, namun hanya mengaktifkan hingga 3 miliar parameter dalam satu waktu. Nemotron 3 Nano difokuskan pada tugas-tugas yang membutuhkan efisiensi tinggi, seperti software debugging, peringkasan konten, pencarian informasi, dan alur kerja asisten AI. Dengan biaya inferensi yang rendah, model ini menjadi pilihan ideal bagi startup maupun tim pengembang yang ingin membangun solusi AI dengan anggaran terbatas.
Nemotron 3 Super
Dirancang sebagai model penalaran berakurasi tinggi, Nemotron 3 Super memiliki sekitar 100 miliar parameter, dengan hingga 10 miliar parameter aktif per token. Model ini cocok untuk aplikasi multi-agen yang membutuhkan koordinasi kompleks namun tetap menuntut latensi rendah, misalnya dalam sistem analitik real-time atau orkestrasi proses bisnis otomatis.
Nemotron 3 Ultra
Sebagai varian paling besar, Nemotron 3 Ultra membawa sekitar 500 miliar parameter, dengan hingga 50 miliar parameter aktif per token. Model ini berfungsi sebagai mesin penalaran tingkat lanjut untuk kebutuhan riset mendalam, perencanaan strategis, dan pengambilan keputusan kompleks di tingkat perusahaan.

Dengan pendekatan bertingkat ini, pengembang dapat memilih model yang “pas ukurannya”, tanpa harus selalu menggunakan model terbesar yang mahal dan boros sumber daya.

Performa Tinggi dengan Biaya Lebih Rendah

Nemotron 3 Nano menjadi sorotan karena efisiensinya yang signifikan. NVIDIA mengklaim model ini mampu menghasilkan hingga empat kali lipat throughput token dibandingkan pendahulunya, Nemotron 2 Nano. Selain itu, kebutuhan token untuk proses penalaran dapat berkurang hingga 60 persen, yang secara langsung menekan biaya inferensi.

Tak kalah penting, Nemotron 3 Nano mendukung jendela konteks hingga 1 juta token. Artinya, model ini mampu “mengingat” dan menghubungkan informasi dalam percakapan atau tugas yang sangat panjang dan bertahap, meningkatkan akurasi serta konsistensi hasil.

Lembaga independen Artificial Analysis bahkan menempatkan Nemotron 3 Nano sebagai salah satu model paling terbuka dan efisien di kelasnya, dengan tingkat akurasi yang kompetitif.

Dukungan untuk Sovereign AI dan Industri Global

Nemotron 3 juga menjadi bagian penting dari strategi sovereign AI NVIDIA. Melalui pendekatan model terbuka, organisasi di berbagai negara—mulai dari Eropa hingga Korea Selatan—dapat membangun sistem AI yang selaras dengan data lokal, regulasi nasional, serta nilai budaya masing-masing.

Sejumlah perusahaan besar telah menjadi pengguna awal Nemotron 3, termasuk Accenture, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Siemens, Synopsys, hingga Zoom. Mereka memanfaatkan Nemotron untuk mendukung alur kerja AI di berbagai sektor, seperti manufaktur pintar, keamanan siber, pengembangan perangkat lunak, media, dan komunikasi digital.

ServiceNow, salah satu mitra utama NVIDIA, melihat Nemotron 3 sebagai pendorong penting dalam percepatan strategi AI agentic lintas industri. Integrasi antara otomatisasi alur kerja cerdas ServiceNow dan Nemotron 3 disebut mampu menghadirkan efisiensi, kecepatan, dan akurasi yang lebih tinggi dibandingkan pendekatan sebelumnya.

Kolaborasi Model Terbuka dan Proprietari

Menariknya, NVIDIA tidak memposisikan Nemotron 3 sebagai pengganti mutlak model proprietari. Sebaliknya, Nemotron dirancang untuk bekerja berdampingan dengan model frontier milik vendor lain. Dalam satu alur kerja, tugas-tugas tertentu dapat dialihkan ke model proprietary dengan kemampuan khusus, sementara Nemotron digunakan untuk menekan biaya dan meningkatkan efisiensi.

Pendekatan ini diapresiasi oleh perusahaan seperti Perplexity, yang menggunakan agent router untuk mengarahkan beban kerja ke model yang paling sesuai. Dengan strategi ini, AI dapat beroperasi secara optimal dari sisi performa maupun biaya.

Ekosistem Terbuka: Dataset dan Alat untuk Pengembang

Tak hanya menghadirkan model, NVIDIA juga merilis tiga triliun token dataset Nemotron yang mencakup pra-pelatihan, pasca-pelatihan, dan reinforcement learning. Dataset ini menyediakan contoh penalaran, pemrograman, serta alur kerja bertahap yang kaya untuk membangun agen AI yang spesifik domain.

Selain itu, NVIDIA memperkenalkan Nemotron Agentic Safety Dataset, yang menyediakan data dunia nyata untuk membantu tim mengevaluasi dan meningkatkan keamanan sistem AI multi-agen.

Untuk mempercepat adopsi, NVIDIA juga meluncurkan library open source NeMo Gym dan NeMo RL, serta NeMo Evaluator untuk validasi kinerja dan keamanan model. Seluruh alat ini tersedia di GitHub dan Hugging Face, memperkuat komitmen NVIDIA terhadap ekosistem AI terbuka.

Ketersediaan dan Roadmap ke Depan

Saat ini, Nemotron 3 Nano sudah tersedia di Hugging Face dan melalui berbagai penyedia layanan inferensi seperti Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter, dan Together AI. Model ini juga didukung sebagai mikroservis NVIDIA NIM™, memungkinkan penerapan yang aman dan skalabel di infrastruktur berbasis akselerasi NVIDIA.

Untuk environment cloud, Nemotron 3 Nano akan tersedia di AWS melalui Amazon Bedrock, serta didukung di Google Cloud dan berbagai penyedia lainnya. Sementara itu, Nemotron 3 Super dan Ultra dijadwalkan meluncur pada paruh pertama 2026.

Penutup

Peluncuran Nemotron 3 menandai langkah penting dalam evolusi AI menuju sistem yang lebih kolaboratif, efisien, dan transparan. Dengan menggabungkan model terbuka, arsitektur MoE yang inovatif, serta ekosistem alat dan data yang lengkap, NVIDIA membuka jalan bagi pengembang dan organisasi untuk membangun AI agentic yang siap digunakan di dunia nyata.

Di tengah meningkatnya kebutuhan otomatisasi cerdas dan pengambilan keputusan berbasis data, Nemotron 3 hadir sebagai fondasi kuat bagi masa depan AI yang tidak hanya canggih, tetapi juga bertanggung jawab dan berkelanjutan.