ابرتراشههای جدید Blackwell Ultra GB300 و Vera Rubin انویدیا از راه رسیدند

ابرتراشههای جدید Blackwell Ultra GB300 و Vera Rubin انویدیا از راه رسیدند
انویدیا پردازندههای گرافیکی هوش مصنوعی جدیدی معرفی کرده که امیدوار است پیشتازیاش در این حوزه را تثبیت کنند: Blackwell Ultra GB300 که در نیمهی دوم ۲۰۲۵ عرضه میشود، Vera Rubin برای نیمهی دوم سال ۲۰۲۶ و Rubin Ultra که در نیمهی دوم ۲۰۲۷ از راه میرسد.
انویدیا با موج انقلاب هوش مصنوعی، هر ثانیه ۲۳۰۰ دلار سود میکند. کسبوکار دیتاسنتر تیم سبز آنقدر بزرگ شده که حتی سختافزارهای شبکهی آن بیشتر از پردازندههای گرافیکی گیمینگ درآمد دارند.
انویدیا در کنفرانس GTC خیلی زود از Blackwell Ultra عبور کرد و معماری بعدی، Vera Rubin را معرفی کرد؛ معماریای که قرار است در مقایسه با نمونهی مشابه Blackwell Ultra، عملکردی ۳٫۳ برابر بهتر در مقیاس رک کامل ارائه دهد.
انویدیا جزئیات زیادی دربارهی تفاوت عملکرد ابرتراشهی Blackwell Ultra با نسخهی اصلی Blackwell ارائه نکرده است. در نشست خبری پیشاز رویداد، تیم سبز گفت که هر تراشهی Ultra همان ۲۰ پتافلاپس توان پردازشی هوش مصنوعی Blackwell را ارائه میدهد؛ اما با ۲۸۸ گیگابایت حافظهی HBM3e بهجای ۱۹۲ گیگابایت.
از سوی دیگر، خوشهی Superpod مدل Blackwell Ultra DGX GB300 همان ۲۸۸ پردازندهی مرکزی، ۵۷۶ پردازندهی گرافیکی و ۱۱٫۵ اگزافلاپس توان محاسباتی FP4 نسخهی بلکول را دارد؛ اما حافظهاش از ۲۴۰ ترابایت به ۳۰۰ ترابایت افزایش یافته است.
انویدیا بیشتر Blackwell Ultra را با H100 مقایسه کرد؛ تراشهای که در سال ۲۰۲۲ پایههای موفقیت هوش مصنوعی این شرکت را بنا گذاشت و حالا احتمالاً شرکتهای پیشرو تمایل دارند به نسخهی جدیدتر ارتقا دهند.
انویدیا میگوید Blackwell Ultra در استنتاج FP4 حدود ۱٫۵ برابر سریعتر است و میتواند «استدلال هوش مصنوعی» را بهطور چشمگیری سرعت ببخشد. برای نمونه، خوشهی NVL72 میتواند نسخهی تعاملی مدل ۶۷۱ میلیارد پارامتری DeepSeek-R1 را در ۱۰ ثانیه اجرا کند، درحالیکه H100 برای انجام همینکار به یک دقیقه و ۳۰ ثانیه زمان نیاز دارد. انویدیا میگوید بلکول اولترا بهدلیل توانایی پردازش هزار توکنبرثانیه ۱۰ برابر سریعتر از تراشههای ۲۰۲۲ این شرکت عمل میکند.
یکی از تفاوتهای جالب نسل جدید، امکان خرید یک تراشهی Blackwell Ultra بهصورت مستقل است. انویدیا ابرکامپیوتر کوچکی بهنام DGX Station معرفی کرده که از تراشهی GB300 Blackwell Ultra بهره میبرد.
انویدیا رک مستقلی بهنام GB300 NVL72 ارائه میدهد که ۱٫۱ اگزافلاپس توان پردازشی FP4، حافظهی HBM به ظرفیت ۲۰ ترابایت، ۴۰ ترابایت «حافظهی سریع»، پهنای باند NVLink معادل ۱۳۰ ترابایتبرثانیه و شبکهای با سرعت ۱۴٫۴ ترابایتبرثانیه دارد.
با ورود تراشههای Vera Rubin در سال ۲۰۲۶ و Rubin Ultra در ۲۰۲۷، عملکرد نسل جدید احتمالاً جهش چشمگیری خواهد داشت. تراشهی Rubin توان پردازشی FP4 را به ۵۰ پتافلاپس میرساند، درحالیکه Blackwell تنها ۲۰ پتافلاپس دارد.
Rubin Ultra با بهرهگیری از تراشهای که در واقع از اتصال دو پردازندهی گرافیکی Rubin ساخته شده، عملکردی دو برابر Rubin و برابر با ۱۰۰ پتافلاپس در FP4 ارائه میدهد و حافظهاش با رسیدن به یک ترابایت، تقریباً چهار برابر بیشتر از نسل قبلی است.
رک کامل NVL576 مجهز به Rubin Ultra، در استنتاج FP4 به توان پردازشی ۱۵ اگزافلاپس و در آموزش FP8 به پنج اگزافلاپس دست مییابد؛ عددی که بهگفتهی انویدیا، ۱۴ برابر عملکرد رک Blackwell Ultra است که امسال عرضه میشود.
انویدیا میگوید تاکنون ۱۱ میلیارد دلار تراشهی Blackwell فروخته است و فقط چهار خریدار اصلی در سال ۲۰۲۵ حدود ۱٫۸ میلیون تراشهی Blackwell خریداری کردهاند.
انویدیا تلاش میکند تمام پردازندههای هوش مصنوعی خود را بهعنوان بخش جداییناپذیر آیندهی محاسبات معرفی کند و استدلال کرد که شرکتها به قدرت پردازشی بیشتر و بیشتری نیاز خواهند داشت.
داستان برند انویدیا؛ از تحول دنیای بازیهای ویدیویی تا رهبری هوش مصنوعی
برخلاف تصور برخی پساز تحولات دیپسیک که منجربه افت قیمت سهام انویدیا شد، جنسن هوانگ، بنیانگذار و مدیرعامل انویدیا، در کنفرانس فناوری GDC گفت: «صنعت برای همگامشدن با تقاضا، ۱۰۰ برابر بیشتر از چیزی که سال گذشته فکر میکردیم، قدرت پردازشی نیاز دارد.»
هوانگ اعلام کرد که معماری بعدی انویدیا پس از Vera Rubin که در سال ۲۰۲۸ معرفی خواهد شد، Feynman نام دارد؛ احتمالاً به افتخار ریچارد فاینمن، فیزیکدان نظری مشهور.