फॉरवर्ड-लुकिंग: NVIDIA के सीईओ जेन्सेन हुआंग ने कंपनी के 2025 GPU प्रौद्योगिकी सम्मेलन में Aii-acelerating GPU की एक मजबूत लाइनअप का अनावरण किया, जिसमें ब्लैकवेल अल्ट्रा B300, वेरा रुबिन और रुबिन अल्ट्रा शामिल हैं। ये GPU AI प्रदर्शन को बढ़ाने के लिए डिज़ाइन किए गए हैं, विशेष रूप से अनुमान और प्रशिक्षण कार्यों में।
ब्लैकवेल अल्ट्रा B300, 2025 की दूसरी छमाही में रिलीज के लिए सेट, मेमोरी क्षमता को 192GB से HBM3E से 288GB तक बढ़ाता है और ब्लैकवेल GB200 की तुलना में घने FP4 टेंसर की गणना में 50% बढ़ावा देता है।
ये संवर्द्धन बड़े एआई मॉडल का समर्थन करते हैं और डीपसेक आर 1 जैसे फ्रेमवर्क के लिए अनुमान प्रदर्शन में सुधार करते हैं। एक पूर्ण NVL72 रैक कॉन्फ़िगरेशन में, ब्लैकवेल अल्ट्रा वर्तमान ब्लैकवेल B200 सेटअप पर एक महत्वपूर्ण छलांग को चिह्नित करते हुए, घने FP4 Inference Compute के 1.1 Exaflops वितरित करेगा।
ब्लैकवेल अल्ट्रा B300 सिर्फ एक स्टैंडअलोन GPU नहीं है। कोर B300 यूनिट के साथ, NVIDIA नए B300 NVL16 सर्वर रैक सॉल्यूशंस, GB300 DGX स्टेशन और GB300 NV72L फुल रैक सिस्टम की शुरुआत कर रहा है।
आठ NV72L रैक के संयोजन से पूर्ण ब्लैकवेल अल्ट्रा DGX सुपरपॉड (ऊपर चित्रित), 288 ग्रेस CPU, 576 ब्लैकवेल अल्ट्रा GPU, HBM3E मेमोरी के 300TB, और FP4 कंप्यूट पावर के एक प्रभावशाली 11.5 Exaflops की विशेषता है। इन प्रणालियों को बड़े पैमाने पर सुपर कंप्यूटर बनाने के लिए आपस में जोड़ा जा सकता है, जिसे NVIDIA “AI कारखानों” कह रहा है।
प्रारंभ में Computex 2024 पर छेड़ा गया, अगले-जीन वेरा रुबिन GPUs को 2026 की दूसरी छमाही में लॉन्च करने की उम्मीद है, विशेष रूप से AI प्रशिक्षण और अनुमान में पर्याप्त प्रदर्शन में सुधार दिया गया।
वेरा रुबिन में दसियों टेराबाइट्स मेमोरी है और इसे एक कस्टम एनवीडिया-डिज़ाइन किए गए सीपीयू, वेरा के साथ जोड़ा जाता है, जिसमें 176 थ्रेड्स के साथ 88 कस्टम आर्म कोर शामिल हैं।
GPU एक एकल मरने पर दो चिप्स को एकीकृत करता है, प्रति चिप के प्रति FP4 अनुमान प्रदर्शन के 50 पेटफ्लॉप्स को प्राप्त करता है। एक पूर्ण NVL144 रैक सेटअप में, वेरा रुबिन FP4 Inference Compute के 3.6 Exaflops वितरित कर सकता है।
वेरा रुबिन की वास्तुकला पर भवन, रुबिन अल्ट्रा को 2027 की दूसरी छमाही में रिलीज के लिए स्लेट किया गया है। यह NVL576 रैक कॉन्फ़िगरेशन का उपयोग करेगा, प्रत्येक GPU के साथ चार रेटिकल-आकार के मर जाते हैं, जिसमें प्रति चिप FP4 सटीकता के 100 पेटफ्लॉप्स प्रदान करते हैं।
रुबिन अल्ट्रा ने FP4 Inference Compute के 15 Exaflops और FP8 प्रशिक्षण प्रदर्शन के 5 Exaflops का वादा किया, वेरा रुबिन की क्षमताओं को पार कर लिया। प्रत्येक रुबिन अल्ट्रा GPU में HBM4E मेमोरी का 1TB शामिल होगा, जो पूरे रैक में 365TB फास्ट मेमोरी में योगदान देता है।
एनवीडिया ने अगली पीढ़ी के जीपीयू आर्किटेक्चर को “फेनमैन” नामक 2028 में वेरा सीपीयू के साथ 2028 में डेब्यू करने की उम्मीद की थी। जबकि विवरण दुर्लभ हैं, फेनमैन को एनवीडिया की एआई कंप्यूटिंग क्षमताओं को आगे बढ़ाने के लिए प्रत्याशित है।
अपने मुख्य वक्ता के दौरान, हुआंग ने एआई के लिए एनवीडिया की महत्वाकांक्षी दृष्टि को रेखांकित किया, डेटा केंद्रों को “एआई कारखानों” के रूप में वर्णित किया जो एआई मॉडल द्वारा संसाधित टोकन का उत्पादन करते हैं। उन्होंने वास्तविक दुनिया के अनुप्रयोगों के लिए आभासी वातावरण में एआई मॉडल को प्रशिक्षित करने के लिए एनवीडिया के सॉफ्टवेयर प्लेटफार्मों का लाभ उठाते हुए, “फिजिकल एआई” को ह्यूमनॉइड रोबोटों को पावर करने की क्षमता पर भी प्रकाश डाला।
एनवीडिया का रोडमैप कम्प्यूटिंग के भविष्य में इन जीपीयू को महत्वपूर्ण है, जो एआई प्रगति के साथ तालमेल रखने के लिए कम्प्यूटेशनल शक्ति की आवश्यकता पर जोर देता है। यह रणनीति तब आती है जब NVIDIA का उद्देश्य हाल के बाजार में उतार -चढ़ाव के बाद निवेशकों को आश्वस्त करना है, इसके ब्लैकवेल चिप्स की सफलता पर निर्माण करना है।

Hello Readers! I am RAHUL KUMAR MAHTO RKM With 3 Year of Experience in Writing Content About Scholarship. With Masters in IT, I love to to write digital content about Government Scholarship Schemes, Private Scholarship Schemes.