Meta Daur Ulang RAM DDR4 Lawas untuk Server AI

Langkah ini bukan sekadar upaya penghematan biasa, melainkan sebuah rekayasa teknis tingkat tinggi yang memadukan inovasi perangkat keras dan perangkat lunak. Yang lebih mengejutkan, kepingan memori usang DDR4 tersebut dipasang ke dalam mesin server AI generasi terbaru yang secara bawaan pabrik hanya mendukung memori DDR5, standar yang jauh lebih cepat dan modern. Tantangan ini seolah-olah menyatukan dua generasi teknologi yang berbeda, sebuah upaya yang secara teknis dianggap mustahil tanpa solusi khusus.

Meta membongkar rahasia di balik keberhasilan ini dalam sebuah presentasi pada konferensi International Symposium on Computer Architecture (ISCA) 2026 pada akhir Juni lalu. Mereka memperkenalkan sebuah chip ASIC (Application-Specific Integrated Circuit) kustom yang diberi nama "Vistara," dirancang khusus untuk mengimplementasikan standar CXL 2.0 (Compute Express Link). Chip pintar inilah yang menjadi jembatan krusial, memungkinkan modul memori (DIMM) DDR4 lawas yang sebelumnya hanya menganggur untuk bekerja mulus berdampingan dengan platform DDR5 generasi baru. Keajaiban Vistara terletak pada kemampuannya untuk melakukan hal tersebut tanpa menimbulkan masalah kompatibilitas yang berarti atau penalti latensi (jeda waktu) yang parah, sebuah pencapaian yang signifikan dalam arsitektur komputasi.

Compute Express Link (CXL) sendiri adalah teknologi antarmuka terbuka berkecepatan tinggi yang memungkinkan konektivitas antara prosesor dan perangkat lainnya, seperti memori dan akselerator, dengan cara yang lebih efisien dan koheren. Dengan CXL, dimungkinkan untuk melakukan "memory pooling" (pengumpulan memori) dan "memory tiering" (penjenjangan memori), di mana berbagai jenis memori dengan karakteristik berbeda dapat diakses dan dikelola secara terpusat oleh sistem. Vistara, sebagai implementasi CXL 2.0 kustom, memanfaatkan kemampuan ini untuk mengintegrasikan memori DDR4 yang lebih lambat namun melimpah sebagai ekstensi dari memori DDR5 utama.

Server AI baru Meta, yang mereka juluki "MemServers," merupakan kekuatan komputasi yang impresif. Mesin-mesin ini ditenagai oleh prosesor AMD Epyc Turin, sebuah chip yang sangat bertenaga dengan 158 core dan 316 thread. Prosesor Turin ini secara teknis dirancang untuk bekerja secara eksklusif dengan RAM DDR5 untuk mencapai performa optimal. Namun, berkat keberadaan chip Vistara, setiap unit MemServer kini mampu memuat total memori gabungan sebesar 1 TB. Konfigurasi memori ini terbagi menjadi dua tingkatan: 768 GB RAM DDR5-6400 yang berfungsi sebagai memori utama berkecepatan tinggi dan terhubung langsung ke prosesor, serta 256 GB RAM DDR4-2400 sebagai memori tambahan yang terhubung via CXL Vistara. Pembagian ini menciptakan sistem memori hibrida yang mengoptimalkan baik kecepatan maupun kapasitas, dua faktor krusial dalam beban kerja AI yang intensif.

Rahasia keberhasilan sistem hibrida ini tidak hanya terletak pada perangkat keras Vistara, tetapi juga pada kecerdasan perangkat lunak yang mengelolanya. Perangkat lunak Vistara memperlakukan kumpulan RAM DDR4 sebagai NUMA (Non-Uniform Memory Access) node terpisah tanpa CPU. Dalam arsitektur NUMA, setiap prosesor atau grup prosesor memiliki akses yang lebih cepat ke memori lokalnya sendiri dibandingkan memori yang terkait dengan prosesor lain. Dengan mengakali sistem untuk melihat DDR4 sebagai node NUMA yang terpisah namun dapat diakses, Meta memungkinkan sistem operasi untuk mengelola alokasi memori secara cerdas.

Strategi inti yang diterapkan adalah pemilahan data berdasarkan frekuensi akses. Data yang paling sering diakses dan krusial untuk performa (dikenal sebagai "hot pages") akan secara otomatis disimpan di memori DDR5 yang melesat cepat, memastikan latensi minimal dan throughput maksimum. Sementara itu, data yang jarang digunakan atau diakses (dikenal sebagai "cold pages") akan "dilempar" ke kumpulan RAM DDR4 yang lebih lambat. Pendekatan "hot-cold tiering" ini memungkinkan Meta untuk memanfaatkan kapasitas besar dari RAM DDR4 lawas tanpa mengorbankan performa untuk tugas-tugas kritis yang membutuhkan kecepatan tinggi. Ini mirip dengan memiliki perpustakaan di mana buku-buku terlaris disimpan di rak depan yang mudah dijangkau, sementara buku-buku lama atau yang jarang dicari disimpan di gudang arsip.

Untuk mewujudkan integrasi yang kompleks ini, tim teknis Meta juga harus melakukan modifikasi mendalam pada driver CXL di sistem operasi Linux mereka. Modifikasi ini penting agar komponen memori DDR4 lawas, yang secara resmi tidak didukung oleh mesin modern, dapat dikenali, dikelola, dan dioptimalkan oleh sistem operasi. Ini menunjukkan tingkat keahlian rekayasa perangkat lunak yang sama tingginya dengan inovasi perangkat keras yang mereka terapkan.

Pendekatan kreatif Meta ini terbukti membuahkan hasil manis dan signifikan. Desain MemServers diklaim mampu memangkas kebutuhan jumlah server inferensi AI hingga 25%. Pengurangan ini tidak hanya berarti penghematan biaya pembelian perangkat keras yang substansial, tetapi juga mengurangi konsumsi daya, kebutuhan pendinginan, dan ruang fisik di pusat data. Lebih lanjut, sistem ini juga berhasil mengurangi beban sistem tambahan (seperti job-restart dan fragmentasi memori) sebesar 33%. Dengan demikian, Meta berhasil menekan anggaran infrastruktur secara masif tanpa harus mengorbankan performa pemrosesan AI mereka secara signifikan. Ini adalah kemenangan ganda: efisiensi biaya dan optimasi performa.

Langkah efisiensi lewat teknologi CXL ini tampaknya mulai menjadi tren yang tak terhindarkan di kalangan raksasa teknologi (hyperscaler) dan perusahaan-perusahaan yang sangat bergantung pada infrastruktur komputasi skala besar. Kebutuhan akan kemampuan untuk mengelola dan memperluas memori secara fleksibel menjadi semakin krusial seiring dengan pertumbuhan data dan kompleksitas model AI. Selain Meta, perusahaan semikonduktor fabless asal Korea Selatan, Panmnesia, juga mempresentasikan teknologi chip pengontrol CXL kustom mereka di ajang ISCA 2026. Teknologi tersebut menawarkan alternatif solusi bagi berbagai perusahaan untuk memadukan perangkat keras beda generasi demi menekan anggaran belanja komponen server yang kian mencekik.

Inovasi Meta dengan Vistara dan MemServers ini bukan hanya tentang daur ulang, tetapi tentang visi ke depan dalam arsitektur komputasi. Ini menunjukkan bahwa di era keterbatasan sumber daya dan tuntutan performa yang tak terbatas, solusi paling inovatif seringkali datang dari pendekatan yang cerdas dan holistik terhadap masalah. Dengan memanfaatkan aset yang ada, memodifikasi perangkat keras, dan mengoptimalkan perangkat lunak, Meta tidak hanya berhasil memangkas biaya tetapi juga mendorong batas-batas kemungkinan dalam desain server AI. Ini adalah contoh nyata bagaimana rekayasa canggih dapat mengatasi kendala ekonomi dan teknis, membuka jalan bagi pengembangan AI yang lebih efisien dan berkelanjutan di masa depan. Demikian dikutip detikINET dari Techspot, Jumat (3/7/2026).