AWS Perkenalkan Trainium2 UltraServer di re:Invent 2024
- Nikita Dewi Kurnia Salwa
- •
- 14 jam yang lalu
Amazon Web Services (AWS), perusahaan penyedia layanan cloud computing asal Amerika Serikat, baru saja mengadakan acara tahunan mereka yang bertajuk "re:Invent:2024" pada Senin, 2 Desember 2024 waktu setempat, atau Selasa pagi waktu Indonesia. Acara ini akan berlangsung hingga 6 Desember 2024, dan berlangsung di Convention Hall The Venetian Hotel, Las Vegas, Nevada.
Sebagai bagian dari pembukaan acara, Peter DeSantis, Senior Vice President of AWS Utility Computing, memberikan presentasi utama yang dikenal dengan nama "Monday Night Live." Dalam kesempatan ini, DeSantis memanfaatkan panggung tersebut untuk membahas produk-produk baru, inovasi, serta solusi terbaru di bidang cloud computing yang ditawarkan oleh AWS. Salah satu topik utama yang dibahas adalah bagaimana AWS berencana untuk memenuhi permintaan yang terus berkembang terkait dengan kebutuhan akan artificial intelligence (AI) serta pelatihan model dan workload inference yang semakin tinggi.
Sebagai bagian dari inisiatif ini, AWS meluncurkan server generasi terbaru yang diberi nama Trainium2 UltraServer, yang dirancang khusus untuk mendukung beban kerja AI dan machine learning (ML). Trainium2 UltraServer ini terdiri dari dua rak besar yang berisi empat server, dan setiap server dilengkapi dengan delapan rak akselerator. Setiap rak akselerator mengandung dua kartu akselerator Trainium2 yang dipasangkan dengan Nitro Cards khusus. Hal ini memungkinkan server baru ini memiliki total 64 akselerator Trainium2 yang dapat bekerja secara simultan, terhubung melalui teknologi Neuro Link, yang menawarkan kecepatan koneksi luar biasa antar server.
DeSantis menjelaskan bahwa Neuro Link ini merupakan inovasi yang membedakan Trainium2 UltraServer dari server tradisional yang mengandalkan protokol jaringan berkecepatan tinggi. Dengan Neuro Link, memori pada setiap server dapat saling terhubung, memungkinkan data dan proses untuk bergerak lebih cepat dan efisien di seluruh sistem.
Sebagai gambaran lebih lanjut, DeSantis menyamakan instans yang dijalankan oleh server ini dengan komputer virtual, seperti laptop atau PC fisik, yang sebenarnya beroperasi di cloud. Setiap instans memiliki spesifikasi yang berbeda, termasuk prosesor, memori, dan jaringan, yang disesuaikan dengan kebutuhan aplikasi yang dijalankan. Semakin kuat spesifikasi instans yang dimiliki, semakin banyak beban kerja kompleks yang dapat ditangani oleh server. Dalam hal ini, Trainium2 merupakan chip akselerator AI generasi kedua yang dikembangkan oleh AWS, dirancang khusus untuk menangani beban kerja yang berat, seperti pelatihan model AI dan ML. Chip ini memiliki kemampuan untuk mendukung model-model AI yang sangat kompleks, termasuk model bahasa besar (Large Language Models/LLM) yang memiliki parameter hingga triliunan.
Dengan meningkatnya jumlah parameter dalam model AI, server yang lebih kuat dan lebih efisien seperti Trainium2 UltraServer ini menjadi semakin penting. Chip Trainium2 dirancang untuk mengatasi tantangan yang terkait dengan pelatihan model AI yang besar dan kompleks, seperti yang digunakan dalam aplikasi natural language processing (NLP) atau pembelajaran mesin yang membutuhkan kapasitas komputasi tinggi. Penggunaan chip akselerator seperti Trainium2 dapat membantu mempercepat proses pelatihan model AI dan ML, yang pada gilirannya mempercepat inovasi di berbagai sektor industri.
Peluncuran Trainium2 UltraServer ini merupakan bagian dari strategi AWS untuk memperkuat posisi mereka dalam pasar komputasi awan, khususnya dalam mendukung kebutuhan yang berkembang pesat dalam bidang kecerdasan buatan. Dengan teknologi terbaru ini, AWS berusaha memberikan solusi yang lebih canggih dan efisien bagi perusahaan-perusahaan yang bergerak di bidang AI dan ML, serta membantu mempercepat adopsi teknologi ini di seluruh dunia. Keberadaan server seperti Trainium2 diharapkan dapat mendukung para pengembang dan peneliti untuk mengatasi tantangan-tantangan besar yang terkait dengan beban kerja AI yang semakin kompleks.
Secara keseluruhan, acara re:Invent 2024 yang digelar oleh AWS ini menunjukkan betapa besar perhatian yang diberikan oleh perusahaan cloud computing tersebut terhadap kemajuan teknologi kecerdasan buatan. AWS tidak hanya berfokus pada penyediaan infrastruktur cloud yang andal dan scalable, tetapi juga berinovasi dalam menciptakan solusi yang dapat mendukung perkembangan AI dan ML di masa depan. Dengan perkenalan Trainium2 UltraServer, AWS berusaha memberikan kemampuan komputasi yang lebih kuat, cepat, dan efisien, yang sangat dibutuhkan untuk mendorong kemajuan teknologi di dunia digital yang terus berkembang ini