Nvidia Vera Resmi, CPU 88 Inti untuk Menjalankan Agen AI

Nvidia Vera Resmi, CPU 88 Inti untuk Menjalankan Agen AI Nvidia kembali mempertegas ambisinya di luar bisnis GPU lewat peluncuran Vera, CPU baru yang dirancang khusus untuk beban kerja agen AI. Prosesor ini membawa 88 inti Olympus rancangan Nvidia, dukungan 176 thread, bandwidth memori sangat besar, serta koneksi cepat ke GPU dalam sistem Vera Rubin. Kehadirannya membuat peta persaingan pusat data semakin menarik karena Nvidia kini tidak hanya bicara soal chip grafis, tetapi juga otak komputasi yang mengatur kerja ribuan agen AI dalam satu infrastruktur.

Vera Dikenalkan sebagai CPU untuk Agen AI

Nvidia menyebut Vera sebagai CPU yang dibuat untuk agentic AI. Istilah ini merujuk pada sistem kecerdasan buatan yang tidak hanya menjawab pertanyaan, tetapi juga menjalankan langkah kerja, memakai alat, menulis dan menjalankan kode, memeriksa hasil, lalu melanjutkan proses secara mandiri sesuai arahan pengguna.

Dalam sistem seperti ini, GPU tetap sangat penting untuk pemrosesan model AI besar. Namun, CPU tidak kalah penting karena bertugas menjalankan banyak pekerjaan pendukung. Mulai dari menjalankan kode Python, mengatur sandbox, memanggil API, mengelola data, melakukan orkestrasi, sampai memastikan GPU terus menerima pekerjaan tanpa jeda panjang.

CPU Tidak Lagi Sekadar Pendamping GPU

Selama ini Nvidia paling dikenal sebagai raja GPU pusat data. Namun, agen AI membuat CPU kembali naik kelas. Ketika satu perintah pengguna bisa memicu banyak langkah kecil, CPU harus menangani banyak proses bersamaan dengan latensi rendah dan kinerja stabil.

Vera hadir untuk menjawab kebutuhan itu. Nvidia menempatkannya bukan sebagai CPU biasa, tetapi sebagai prosesor yang memahami jenis pekerjaan baru di pusat data AI. Ia disiapkan untuk menjalankan beban yang banyak, bercabang, dan terus bergerak.

Membawa 88 Inti Olympus Buatan Nvidia

Spesifikasi paling menonjol dari Vera adalah 88 inti Olympus. Ini merupakan inti CPU rancangan Nvidia yang dibuat untuk pekerjaan intensif di pusat data. Jumlah inti sebesar ini memberi ruang besar untuk menjalankan banyak proses secara paralel.

Nvidia juga membekali Vera dengan Spatial Multithreading. Setiap inti dapat menjalankan dua tugas, sehingga totalnya mencapai 176 thread. Bagi pusat data yang menjalankan banyak agen AI dalam waktu bersamaan, kemampuan seperti ini sangat penting.

176 Thread untuk Banyak Lingkungan Kerja

Agen AI sering membutuhkan lingkungan terpisah. Misalnya satu agen menjalankan kode, agen lain mengambil data, agen lain melakukan evaluasi, dan agen lain menyiapkan jawaban. Semua proses itu bisa berjalan bersamaan.

Dengan 176 thread, Vera dapat menangani banyak tugas tanpa membuat sistem terlalu cepat macet. Nvidia menekankan bahwa Vera dirancang memberi kinerja yang lebih mudah diprediksi, terutama ketika dipakai dalam lingkungan multi tenant atau pusat data yang melayani banyak pelanggan.

LPDDR5X Jadi Senjata Memori

Vera memakai subsistem memori LPDDR5X dengan bandwidth hingga 1,2 TB per detik. Angka ini sangat besar untuk sebuah CPU dan menjadi salah satu alasan Nvidia percaya diri menyebut Vera cocok untuk beban AI modern.

Memori cepat dibutuhkan karena agen AI tidak hanya menjalankan model, tetapi juga memproses banyak data pendukung. Data dapat datang dari dokumen, basis data, log aplikasi, hasil pencarian internal, kode program, dan alat lain yang dipakai agen.

Bandwidth Tinggi Membantu Ribuan Proses Tetap Responsif

Saat banyak agen berjalan, CPU harus terus memindahkan data dari memori ke inti pemrosesan. Jika bandwidth memori sempit, inti CPU bisa menunggu data terlalu lama. Kondisi itu membuat agen terasa lambat dan GPU ikut kekurangan pasokan pekerjaan.

Dengan bandwidth tinggi, Vera berupaya menjaga semua proses tetap responsif. Nvidia juga menyebut pendekatan LPDDR5X memberi efisiensi daya lebih baik dibanding memori CPU tradisional, sehingga cocok untuk pusat data yang sangat memperhatikan konsumsi energi.

Kapasitas Memori hingga 1,5 TB

Selain cepat, Vera juga dapat mendukung kapasitas memori hingga 1,5 TB. Kapasitas besar ini penting untuk pusat data AI karena beban kerja modern membutuhkan ruang data yang sangat luas. Agen AI dapat memegang banyak status kerja, dokumen, cache, dan hasil antara.

Dalam pekerjaan reinforcement learning, data juga bergerak dalam jumlah besar. Sistem perlu menyimpan simulasi, hasil evaluasi, dan banyak lingkungan uji secara bersamaan. CPU dengan memori besar memberi keleluasaan lebih baik untuk pekerjaan seperti itu.

SOCAMM Membuat Memori Bisa Diganti

Nvidia menyebut Vera memakai modul SOCAMM yang dapat dilepas dan diganti. Ini menarik karena LPDDR biasanya identik dengan memori tertanam. Dengan SOCAMM, pusat data dapat memperoleh efisiensi LPDDR, tetapi tetap memiliki ruang servis dan peningkatan kapasitas.

Bagi operator pusat data, kemudahan servis sangat penting. Perangkat harus dapat diperbaiki dan ditingkatkan tanpa mengganti seluruh sistem. Vera mencoba menggabungkan efisiensi perangkat mobile dengan fleksibilitas kelas server.

NVLink C2C Hubungkan CPU dan GPU Lebih Cepat

Vera tidak berdiri sendiri. CPU ini menjadi bagian dari sistem yang dapat dipasangkan dengan GPU Nvidia, termasuk dalam platform Vera Rubin. Koneksi NVLink C2C memberi bandwidth koheren hingga 1,8 TB per detik antara CPU dan GPU.

Koneksi cepat ini penting karena AI modern membutuhkan kerja sama erat antara CPU dan GPU. CPU mengatur banyak proses, sementara GPU menjalankan komputasi berat. Jika hubungan keduanya lambat, seluruh sistem ikut tertahan.

Jalur Cepat untuk Data Besar

Dalam pusat data AI, data tidak selalu berada di satu tempat. Ada data yang berada di CPU, ada yang berada di GPU, ada yang berada di memori sistem, dan ada pula yang berada di penyimpanan jaringan. NVLink C2C membantu mengurangi hambatan perpindahan data antara CPU dan GPU.

Dengan koneksi cepat, Vera dapat memberi makan GPU lebih stabil. Ini menjadi nilai penting karena GPU mahal tidak boleh terlalu sering menunggu CPU. Setiap waktu tunggu berarti sumber daya pusat data tidak dimanfaatkan dengan baik.

Scalable Coherency Fabric Generasi Kedua

Vera memakai Scalable Coherency Fabric generasi kedua. Teknologi ini menghubungkan semua 88 inti, cache, memori, input output, dan NVLink C2C dalam satu struktur yang cepat. Nvidia menyebut bandwidth bisectional mencapai 3,4 TB per detik.

Bagian ini penting karena CPU dengan banyak inti membutuhkan jalur komunikasi internal yang kuat. Jika inti banyak tetapi jalur internal lemah, kinerja bisa tidak merata. Vera mencoba mengatasi persoalan tersebut dengan arsitektur monolitik dan fabric cepat.

Mengurangi Hambatan Antar Inti

Pada beberapa desain chip, komunikasi antar bagian dapat terhambat karena data harus melewati banyak jalur. Vera dirancang agar seluruh inti dapat mengakses data dengan lebih konsisten. Hal ini membantu menjaga latensi tetap stabil.

Untuk beban kerja agen AI, stabilitas latensi penting. Agen tidak hanya perlu cepat pada satu proses, tetapi juga harus konsisten saat menangani banyak proses dalam waktu sama.

Diklaim 1,8 Kali Lebih Cepat dari x86

Nvidia menyebut Vera mampu menyelesaikan tugas hingga 1,8 kali lebih cepat dibanding CPU x86 pada sejumlah beban agentic AI. Beban yang disebut meliputi kompilasi kode, Python, dan analisis kode. Tiga pekerjaan ini sering muncul dalam alur agen AI yang menjalankan tugas pemrograman atau analisis teknis.

Klaim ini menunjukkan bahwa Nvidia ingin menantang dominasi CPU tradisional di pusat data. Selama puluhan tahun, x86 menjadi tulang punggung server. Vera mencoba menawarkan jalur berbeda berbasis Arm dan rancangan internal Nvidia.

Fokus pada Beban Kerja yang Banyak Dipakai Agen

Agen AI tidak hanya memanggil model bahasa. Ia sering menjalankan kode, mengetes hasil, memperbaiki kesalahan, lalu menjalankan ulang. Proses ini sangat bergantung pada CPU. Jika CPU lebih cepat menjalankan kompilasi dan Python, agen bisa menyelesaikan tugas dengan lebih singkat.

Kecepatan seperti ini dapat berpengaruh pada biaya pusat data. Semakin cepat satu tugas selesai, semakin banyak permintaan yang bisa dilayani. Bagi penyedia cloud dan laboratorium AI, efisiensi seperti ini menjadi hal yang sangat bernilai.

Vera Masuk Produksi Penuh

Nvidia menyatakan Vera kini masuk produksi penuh. Ini berarti chip tersebut bukan hanya konsep di panggung presentasi. Perusahaan menyebut sejumlah laboratorium AI, penyedia cloud, dan perusahaan teknologi besar sedang mengevaluasi atau menyiapkan penggunaan Vera.

Nama yang disebut mencakup Anthropic, OpenAI, SpaceXAI, ByteDance, CoreWeave, Lambda, Nebius, Nscale, dan Oracle Cloud Infrastructure. Kehadiran nama besar ini memperlihatkan bahwa Vera langsung diarahkan ke pasar pusat data kelas atas.

Produsen Server Mulai Menyiapkan Sistem

Selain pelanggan cloud dan AI, Nvidia juga menyebut banyak produsen sistem ikut membangun perangkat berbasis Vera. Dell Technologies, HPE, Lenovo, Supermicro, Asus, Foxconn, Gigabyte, Quanta Cloud Technology, Wistron, dan Wiwynn masuk dalam daftar ekosistem.

Dukungan banyak produsen penting karena chip pusat data membutuhkan rantai pasok besar. Pelanggan tidak hanya membeli CPU, tetapi membeli server, rak, jaringan, penyimpanan, pendinginan, perangkat lunak, dan layanan pendukung.

Vera Rubin Jadi Platform Besar Nvidia

Vera menjadi bagian penting dalam platform Vera Rubin. Dalam konfigurasi rak NVL72, platform ini menyatukan CPU Vera, GPU Rubin, jaringan NVLink, DPU BlueField, dan komponen lain untuk membangun infrastruktur AI skala besar.

Nvidia menyebut Vera Rubin memberi peningkatan besar untuk throughput agen dibanding generasi Grace Blackwell. Artinya, perusahaan tidak hanya menjual chip terpisah, tetapi menawarkan desain pusat data lengkap.

Bukan Hanya Chip, tetapi Infrastruktur

Pendekatan Nvidia makin jelas. Perusahaan ingin menjadi pemasok infrastruktur penuh untuk pabrik AI. Di dalamnya ada CPU, GPU, jaringan, DPU, storage, software, serta rancangan rak.

Vera berperan sebagai otak pengatur banyak proses, sementara GPU Rubin mengerjakan komputasi berat. Kombinasi keduanya diarahkan agar pusat data mampu menjalankan agen AI dalam jumlah besar dengan biaya per token lebih rendah.

Vera Juga Bisa Berdiri Sendiri

Meski erat dengan Vera Rubin, CPU Vera juga disiapkan sebagai prosesor mandiri. Nvidia menyebut Vera dapat dipakai dalam server standalone untuk beban agentic AI, reinforcement learning, analitik, pemrosesan data, sampai high performance computing.

Ini memperluas pasar Vera. Tidak semua pelanggan membutuhkan rak GPU raksasa. Ada perusahaan yang membutuhkan CPU kuat untuk menjalankan ribuan lingkungan sandbox, pipeline data, atau layanan agen internal.

Pilihan untuk Cloud dan Enterprise

Penyedia cloud dapat memakai Vera untuk layanan CPU intensif. Perusahaan besar dapat memakainya untuk sistem AI internal. Laboratorium riset dapat menggunakannya untuk simulasi dan eksperimen reinforcement learning.

Dengan mode standalone, Vera menjadi pesaing langsung CPU server dari Intel, AMD, dan Arm server lain. Bedanya, Nvidia membawa ekosistem AI lengkap yang sudah kuat di GPU dan software.

Mengapa Agen AI Butuh CPU Khusus

Agen AI bekerja berbeda dari chatbot biasa. Chatbot umumnya menerima pertanyaan lalu menghasilkan jawaban. Agen AI dapat memecah tugas menjadi banyak langkah. Ia bisa mencari data, membuat file, menjalankan kode, mengecek kesalahan, memanggil layanan eksternal, dan mengulang sampai hasil sesuai.

Setiap langkah membutuhkan CPU. Jika ribuan agen berjalan bersamaan, kebutuhan CPU menjadi sangat besar. Inilah alasan Nvidia menilai CPU tradisional menjadi hambatan baru di pusat data AI.

CPU Mengurus Kerja yang Tidak Terlihat

Pengguna sering hanya melihat jawaban akhir dari AI. Di balik itu, ada banyak proses kecil. Sistem menjalankan skrip, membuka lingkungan virtual, membaca data, mengurai dokumen, mengelola cache, dan mengatur antrean tugas.

Semua pekerjaan itu bukan tugas utama GPU. GPU kuat untuk matriks dan model AI, tetapi CPU mengatur alur kerja. Vera hadir untuk mempercepat bagian yang sering tidak terlihat tetapi sangat menentukan.

Keamanan dan Multi Tenant Ikut Ditekankan

Pusat data AI melayani banyak pelanggan dan banyak proyek dalam satu infrastruktur. Karena itu, isolasi, keamanan data, dan pengelolaan tenant menjadi sangat penting. Nvidia menyebut platform Vera Rubin juga terhubung dengan BlueField 4 DPU untuk jaringan, penyimpanan, dan keamanan.

Dalam sistem agen AI, keamanan menjadi lebih sensitif karena agen dapat mengakses data, menjalankan alat, dan memproses informasi rahasia. CPU dan infrastruktur pendukung harus mampu menjaga pemisahan antar lingkungan.

Data Perusahaan Harus Tetap Terjaga

Banyak perusahaan ingin memakai agen AI untuk pekerjaan internal, tetapi khawatir terhadap keamanan data. Jika agen bekerja di pusat data bersama, mereka perlu jaminan bahwa data tidak bocor ke pelanggan lain.

Vera dan platform Nvidia yang lebih luas mencoba menjawab kebutuhan ini lewat confidential computing, isolasi jaringan, serta pengelolaan keamanan di tingkat infrastruktur.

Persaingan CPU Pusat Data Makin Panas

Masuknya Vera memperkuat persaingan di pasar CPU pusat data. Intel dan AMD selama ini menguasai server x86. Arm juga terus tumbuh lewat berbagai rancangan CPU hemat daya untuk cloud. Nvidia kini datang membawa kekuatan brand AI dan ekosistem GPU yang sangat dominan.

Keunggulan Nvidia terletak pada integrasi. Pelanggan yang sudah memakai GPU Nvidia dapat tertarik memakai CPU Vera karena koneksinya dirancang sangat erat dengan GPU dan software Nvidia.

Intel dan AMD Tidak Bisa Dianggap Ringan

Meski Vera terlihat menarik, Intel dan AMD memiliki basis pelanggan sangat besar, kompatibilitas luas, serta pengalaman panjang di server. Banyak perusahaan sudah memakai ekosistem x86 selama bertahun tahun.

Nvidia perlu membuktikan bahwa Vera tidak hanya cepat pada beban tertentu, tetapi juga stabil, mudah diadopsi, dan layak dari sisi biaya total. Dukungan software dan migrasi aplikasi akan menjadi bagian penting.

Arm Menjadi Fondasi Penting Vera

Vera berbasis arsitektur Armv9.2. Pilihan ini menunjukkan bahwa Arm semakin kuat di pusat data. Arm tidak lagi hanya identik dengan smartphone atau perangkat hemat daya. Kini arsitektur tersebut dipakai untuk server cloud, superkomputer, dan chip AI.

Keunggulan Arm sering dikaitkan dengan efisiensi energi dan fleksibilitas rancangan. Nvidia memakai dasar Arm untuk membuat inti Olympus sendiri, sehingga dapat menyesuaikan CPU dengan kebutuhan AI.

Efisiensi Energi Jadi Kunci Pusat Data

Pusat data AI membutuhkan listrik dalam jumlah besar. Setiap peningkatan efisiensi dapat mengurangi biaya operasional. CPU yang lebih hemat daya tetapi tetap kuat menjadi pilihan menarik bagi penyedia layanan cloud.

Vera mencoba menggabungkan banyak inti, bandwidth memori besar, dan efisiensi Arm. Jika hasil di lapangan sesuai klaim Nvidia, CPU ini dapat menjadi pilihan kuat untuk pusat data yang ingin menambah kapasitas agen AI.

Tabel Spesifikasi Utama Nvidia Vera

Berikut gambaran utama spesifikasi Vera yang paling banyak disorot.

Bagian	Nvidia Vera
Jenis chip	CPU pusat data untuk agen AI
Arsitektur	Armv9.2
Inti CPU	88 core Olympus rancangan Nvidia
Thread	176 thread dengan Spatial Multithreading
Memori	LPDDR5X dengan SOCAMM
Bandwidth memori	Hingga 1,2 TB per detik
Kapasitas memori	Hingga 1,5 TB
Interkoneksi CPU GPU	NVLink C2C hingga 1,8 TB per detik
Fabric internal	Scalable Coherency Fabric generasi kedua
Bandwidth fabric	Hingga 3,4 TB per detik
Target penggunaan	Agentic AI, reinforcement learning, data processing, analytics, HPC
Status	Produksi penuh

Spesifikasi tersebut menunjukkan bahwa Vera bukan CPU konsumen. Chip ini dirancang untuk pusat data, cloud, laboratorium AI, dan infrastruktur komputasi yang menjalankan banyak pekerjaan secara bersamaan.

Apa Artinya bagi Pengguna Umum

Pengguna biasa mungkin tidak akan membeli CPU Vera secara langsung. Chip ini bukan untuk laptop rumahan atau komputer gaming. Namun, pengguna tetap bisa merasakan hasilnya lewat layanan AI yang dipakai sehari hari.

Jika Vera berhasil mempercepat agen AI di pusat data, layanan seperti asisten coding, pencarian berbasis AI, otomasi kantor, analisis data, dan chatbot perusahaan dapat berjalan lebih cepat. Respons bisa menjadi lebih singkat dan biaya layanan berpotensi ditekan.

Layanan AI Bisa Lebih Gesit

Agen AI yang bekerja lambat sering membuat pengguna tidak sabar. Jika satu tugas membutuhkan banyak langkah, sistem harus menjalankan banyak proses. CPU yang lebih cepat dapat membantu mengurangi waktu tunggu.

Bagi perusahaan, respons yang lebih cepat berarti layanan pelanggan lebih baik. Bagi pengembang, agen coding dapat menjalankan tes lebih cepat.

Posisi Vera dalam Strategi Besar Nvidia

Vera memperlihatkan bahwa Nvidia ingin menguasai lebih banyak lapisan komputasi AI. Perusahaan tidak puas hanya menjual GPU. Nvidia kini menyediakan CPU, GPU, jaringan, DPU, software, rak server, hingga desain pusat data.

Strategi ini membuat pelanggan lebih mudah memakai satu ekosistem penuh. Namun, sekaligus membuat Nvidia semakin dominan di industri AI. Bagi pasar, dominasi itu dapat memberi kecepatan inovasi, tetapi juga membuat banyak perusahaan sangat bergantung pada satu pemasok.

Ekosistem CUDA Tetap Menjadi Modal Besar

Salah satu kekuatan Nvidia adalah software. CUDA, TensorRT, cuDNN, Triton, dan berbagai pustaka AI sudah dipakai luas. Dengan Vera, Nvidia dapat menghubungkan CPU baru ke ekosistem yang sudah dipercaya banyak pengembang.

Jika software berjalan mulus, adopsi Vera bisa lebih cepat. Pelanggan tidak hanya melihat spesifikasi chip, tetapi juga kemudahan menjalankan aplikasi yang sudah mereka pakai.

Tantangan Adopsi Vera

Meski tampak kuat, Vera tetap menghadapi beberapa tantangan. Pertama, pelanggan perlu menyesuaikan beban kerja agar benar benar mendapat manfaat. Kedua, pusat data harus memastikan kompatibilitas software, keamanan, jaringan, dan pendinginan. Ketiga, harga total sistem harus masuk akal dibanding CPU lain.

Selain itu, migrasi dari x86 ke Arm tidak selalu sederhana. Banyak aplikasi enterprise sudah lama dibangun di atas x86. Meski ekosistem Arm semakin matang, pengujian tetap diperlukan.

Pengujian Lapangan Menjadi Penentu

Klaim performa Nvidia akan diuji oleh pelanggan besar. Mereka akan melihat kinerja pada beban nyata, bukan hanya angka presentasi. Pengujian mencakup kompilasi, database, Python, analitik, workload internal, serta integrasi dengan GPU.

Jika Vera stabil dan memberi keuntungan biaya, adopsinya bisa meluas. Jika migrasi terlalu rumit atau biaya terlalu tinggi, pelanggan mungkin tetap memakai kombinasi CPU lama dan GPU Nvidia.

Vera Menandai Babak Baru CPU Nvidia

Nvidia sebenarnya sudah memiliki Grace CPU sebelumnya. Vera dapat dibaca sebagai penerus yang lebih disiapkan untuk era agen AI. Dengan 88 inti, 176 thread, memori sangat cepat, dan koneksi erat ke GPU, Vera membawa Nvidia lebih serius ke pasar CPU pusat data.

Langkah ini membuat persaingan komputasi AI semakin luas. Pertarungan tidak lagi hanya siapa punya GPU tercepat, tetapi siapa mampu membangun sistem lengkap yang paling efisien untuk menjalankan agen AI dalam jumlah besar.

Hal yang Perlu Dipantau dari Vera

Setelah pengumuman dan produksi penuh, perhatian berikutnya mengarah pada sistem yang memakai Vera. Server dari Dell, HPE, Lenovo, Supermicro, Asus, Gigabyte, Foxconn, QCT, Wistron, dan produsen lain akan menjadi etalase utama.

Hal lain yang perlu dilihat adalah hasil uji independen, harga cloud instance berbasis Vera, performa untuk coding agent, efisiensi energi, serta keberhasilan Vera Rubin di pusat data skala besar. Dari sana, industri dapat menilai apakah CPU 88 inti ini benar benar menjadi otak baru bagi agen AI modern.

Post Views: 27