Komunitas machine learning dan deep learning kembali menyambut kabar gembira dengan dirilisnya PyTorch 2.9, versi terbaru dari framework open-source terkemuka untuk penelitian dan produksi AI. Rilis ini membawa lompatan signifikan dalam hal skalabilitas multi-GPU, efisiensi inferensi model bahasa besar (Large Language Model, LLM), serta ekspansi dukungan perangkat keras lintas platform, termasuk AMD ROCm, Intel XPU, dan CPU Arm.
Diumumkan melalui blog resmi PyTorch, versi 2.9 mencakup 3.216 commit dari 452 kontributor sejak rilis PyTorch 2.8, yang menegaskan komitmen proyek terhadap kolaborasi komunitas global dan inovasi berkelanjutan.
Salah satu sorotan utama PyTorch 2.9 adalah pengenalan Symmetric Memory, fitur API-unstable yang memungkinkan pengembang menulis kernel multi-GPU dengan komunikasi langsung melalui NVLink atau jaringan RDMA. Fitur ini membuka tiga peluang baru dalam penggunaan GPU, yaitu:
all_to_all_vdev.Fitur ini tersedia melalui modul torch.ops.symm_mem dan saat ini mendukung backend CUDA dan NVSHMEM.
Bagi pengembang yang membuat ekstensi C++ atau CUDA kustom, PyTorch 2.9 memperluas libtorch ABI yang stabil. API baru seperti torch::stable::Tensor, utilitas perangkat (Device Guard, Stream), serta operasi ATen stabil (amax, narrow, pad, dll.) memungkinkan ekstensi dibangun sekali dan dijalankan di berbagai versi PyTorch, seperti yang telah diimplementasikan pada FlashAttention 3.
Meski masih dalam status preview, inisiatif ini menjadi langkah penting menuju ekosistem ekstensi yang lebih kompatibel dan andal.
torch.compilePyTorch 2.9 memperkenalkan torch._dynamo.error_on_graph_break(), sebuah context manager yang memungkinkan pengguna secara dinamis memilih apakah ingin menghentikan eksekusi atau melanjutkannya saat terjadi graph break dalam kode yang dikompilasi. Berbeda dengan mode fullgraph yang bersifat tetap, fitur ini memberikan fleksibilitas lebih besar dalam debugging dan optimasi.
Sebagai bagian dari partisipasi dalam inisiatif WheelNext, PyTorch 2.9 kini menyediakan binary wheel resmi untuk:
Fitur ini mempermudah instalasi dan deteksi otomatis perangkat keras, memperluas akses PyTorch ke berbagai arsitektur komputasi AI.
PyTorch 2.9 juga memperkuat dukungan untuk arsitektur Arm AArch64, termasuk:
torch.compile pada benchmark TorchBench, Hugging Face, dan TIMM.Pengguna dapat menginstal PyTorch 2.9 melalui sistem manajemen paket modern seperti uv:
# Linux/macOS
curl -LsSf https://astral.sh/uv/install.sh | INSTALLER_DOWNLOAD_URL=https://wheelnext.astral.sh/v0.0.2 sh
uv venv
uv pip install torch
# Windows
powershell -c { $env:INSTALLER_DOWNLOAD_URL = 'https://wheelnext.astral.sh/v0.0.2'; irm https://astral.sh/uv/install.ps1 | iex }
uv venv
uv pip install torch
Dengan PyTorch 2.9, tim pengembang tidak hanya memperluas cakupan perangkat keras, tetapi juga membangun fondasi untuk sistem AI yang lebih cepat, fleksibel, dan terdistribusi. Fitur-fitur seperti Symmetric Memory dan dukungan LLM yang diperluas menunjukkan arah jelas menuju scalable AI infrastructure generasi berikutnya.
Komunitas diajak untuk mencoba fitur-fitur baru ini dan melaporkan masukan demi penyempurnaan lebih lanjut.
Pelajari lebih lanjut dan mulai menggunakan PyTorch 2.9 di: https://pytorch.org