Kasra
Kasra
خواندن ۳۶ دقیقه·۹ ماه پیش

بررسی عملکرد Nvidia از ابتدا تا به امروز (2024)

حتما به یاد دارید که حوالی سال ۲۰۱۸، برای اولین بار شاهد رشد چشم‌گیر ارزش ارزهای دیجیتال در دنیا به صورت همه‌گیر بودیم و اتفاقات این حوزه نه‌تنها در کل شبکه‌های اجتماعی ترند شده بود؛ بلکه تیتر یک اخبار، گفتگوها و حتی صحبت‌های روزمره مردم معمولی هم بود.
منطق به ما می‌گوید که اگر ارزش یک دارایی زیاد شود، اشتهای افراد برای به‌دست‌آوردن هر مقدار بیشتری از آن دارایی نیز به رشد تصاعدی منجر می‌شود.
به همین دلیل با رشد ارزهای دیجیتال در سال ۲۰۱۸، کم‌کم نام سایر کمپانی‌های وابسته به این رشد هم به گوش رسید. اگر رشد ارزهای دیجیتال را نه یک نقطه خاص، بلکه فرایندی شناور در طول بازه زمانی یک ساله در نظر بگیریم، متوجه می‌شویم که دقیقا به موازات رشد مثلا بیت‌کوین یا اتریوم، یک شرکت مطرح آمریکایی نیز به رشد چشم‌گیر و قابل توجهی دست یافته است..


آنچه خواهیم خواند:


بخش اول - بررسی اجمالی انویدیا
⚪ معرفی انویدیا
⚪ یک حدس مهندسی
⚪ پیش‌بینی درست آینده
⚪ تفاوت GPU با CPU
⚪ انویدیا، یک هایپ‌سوار قهار
⚪ بحران کمبود ریزتراشه‌های جهانی در پی انتشار کووید ۱۹
⚪ واکنش انویدیا به بحران جهانی کمبود ریزتراشه
⚪ هایپ هوش مصنوعی


بخش دوم - بررسی رویداد GTC 2024
🟣 پردازنده‌های سری Blackwell (B100, B200, GB200 &..)
🟣 سوپرتراشه GB200 (Grace Blackwell)
🟣 هوش مصنوعی مولد (Generative AI) و (Nvidia Inference Microservice) NIM
🟣 برنامه همکاری جدید با مدیاتک
🟣 توسعه Omniverse و Vision Pro
🟣 تمهیدات اولیه در راستای راهکارهای مبتنی بر 6G



بخش اول - بررسی اجمالی انویدیا



انویدیا

یک شرکت تولیدکننده پردازنده‌های گرافیکی که از سال ۱۹۹۳ پای به عرصه شرکت‌های فناوری‌محور آمریکایی گذاشت. این شرکت توسط سه مهندس با نام‌های جنسن هوانگ (Jensen Huang)، کورتیس پرایم (Curtis Priem) و کریس مالکووسکی (Chris Malachowsky) تاسیس شد.
اما مثل خیلی جاهای دیگر که اصرار بر شخصیت افراد بنیان‌گذار دارند، بهتر است به جای اصرار بر شناخت بنیان‌گذاران، ببینیم که آن‌ها به چه چیزی فکر می‌کردند؟ با این فرض که نه‌تنها ثروت، بلکه هر نوع پیشرفت در جوامع انسانی ریشه در اندیشه دارد.

یک حدس مهندسی

تصور کنید که در دهه ۹۰ میلادی، تا چه حد می‌شد آینده را درست همانند آنچه که الان شاهدش هستیم، پیش‌بینی کرد؟ تصور سینماگران از آینده، شهرهای فوق هوشمند در سال ۲۰۲۰ بود که در آن، تاکسی‌های پرنده و قطارشهری‌های سریع‌السیر جولان می‌دهند که این یک تصور یوتوپیایی بود. در آن سمت ما نمونه‌هایی همچون سه‌گانه ماتریکس را داریم که تصور دیستوپیایی خود از آینده رباتی را نیز به تصویر می‌کشند.
یا در میان قشر صنعتگر، سرمایه‌گذار، مهندسان، هنرمندان، مردم عادی و ... که نگاه کنیم؛ همه کنجکاو جلوه‌های چشم‌نواز و متفاوت آینده نسبت به دنیای امروز هستند.
اما شاید در این میان، افرادی نیز بودند که آینده را از منظر دیگری تصور می‌کردند. مثلا از منظر اینکه اگر بر فرض که دنیا در سیطره ربات‌ها در بیاید و به‌قول معروف، "نون تو ربات" باشد؛ چه کسی در این میان بیش از سایرین سود و منفعت خواهد برد؟
همان ضرب‌المثل که "در سرزمینی که همه در جستجوی طلا هستند، تو بیل بفروش!" و از این حرف‌ها..
امروز نیز داده طلاست و انویدیا، بیل‌فروش!


پیش‌بینی درست آینده

آن اندیشه‌ای که باعث موفقیت انویدیا در امروز شده، ارتباط مستقیم و ماهوی با مفهومی که به‌زودی به آن می‌پردازیم دارد، لذا لطفا دقت بیشتری برای مطالعه این بخش لحاظ فرمایید.
سه مهندس داستان ما، در سال ۹۳، پیش‌بینی کردند که موج واپسین صنعت کامپیوتر، نسبت به موج پیشین، به دلیل جاه‌طلبی انسان و خواسته‌های بی‌حدوحصر آن از فناوری، به محاسبات بسیار سنگین‌تری برای کاربرد نرم‌افزاری نیاز خواهد داشت.
یعنی در زمانی که خبرگان حوزه نرم‌افزار، مبهور رشد تصاعدی صنعت نرم‌افزار نسبت به سخت‌افزار بودند؛ جنسن هوانگ و هم‌بنیان‌گذاران خیلی واقع‌بینانه‌تر از سایرین به آینده نگاه می‌کردند و می‌توانستند پیش‌بینی کنند رشد تصاعدی در نرم‌افزار خیلی عالی‌ست اما هیچ‌زمان نمی‌تواند جای محاسبات محض را بگیرد!
لذا به خوبی و به درستی این ایده را مطرح کردند که محاسبات نسل بعدی صنعت کامپیوتر، به پردازنده‌های مبتنی بر گرافیک و محاسبات سریع نیاز دارد تا محاسبات مبتنی بر CPU و پردازنده‌های مرسوم.
به‌طور خلاصه، CPU یک مدار الکترونیکی‌ست که دستورات سیستم‌عامل را اجرا می‌کند و سیستم‌عامل هم همان واسط ارتباطی بین کاربر و سخت‌افزار که در مثال ما، CPU باشد، است. (مثل ویندوز یا توزیع لینوکسی اوبونتو)
اما GPU، مانند یک CPU اختصاصی برای انجام یکسری کارهای خاص است مثل محاسبات مورد نیاز برای پخش ویدیو یا تصاویر. منتها این دو چه تفاوتی با هم دارند؟


تفاوت GPU با CPU

خیلی ساده بخواهم بگویم؛ CPU مانند گروه کوچکی از افراد بسیار باهوش عمل می‌کند که می‌توانند یکسری کارهای عمومی را به سرعت انجام دهند. (یعنی کاربرد عام (عمومی) و همه‌منظوره دارند)
اما GPU داستان متفاوتی دارد، آن را گروه وسیعی از افراد نادان یا متوسط در نظر بگیرید که به خودی خود سریع یا باهوش نیستند؛ اما از آن‌جایی که برای انجام کارهای تکراری آموزش می‌بینند و تعداد آن‌ها نیز پرشمار است، می‌توانند بازدهی بسیار بالاتری را در انجام امور خاص از خود نشان دهند. (کاربرد خاص دارند که این سرعت محاسبات را افزایش می‌دهد)
یک CPU عمدتا بین ۱ تا ۴ هسته پردازشی همچنین کلاک معادل ۱ تا ۴ گیگاهرتز دارد. (واژه کلاک (Clock) اشاره به سرعت کلاک یک وسیله محاسبه‌گر مانند رایانه دارد. سرعت کلاک بر حسب هرتز بیان می‌شود و نشان‌دهنده سرعت عمومی یک وسیله است - یعنی ۴ گیگاهرتز معادل با ۴ میلیارد چرخه محاسباتی کلاک در ثانیه است - برای مثال پردازنده با نرخ فرکانس ۴ گیگاهرتز می‌تواند در هر ثانیه، ۴ میلیون کار پردازشی انجام دهد)
البته در جریان باشید که هر کار پردازشی ممکن است خودش نیازمند چند کار پردازشی دیگر نیز باشد که یعنی ۴ میلیون کار پردازشی در ثانیه را باید تقسیم بر تعداد کار پردازشی داخل هر کار پردازشی کنیم که طبیعتا مقدار کمتری خواهد شد.
در خصوص GPU اما، اساسا مجموعه‌ای از ترانزیستورها طراحی شده‌اند که انجام محاسبات مورد نیاز برای ارسال سیگنال‌های الکتریکی صفحه نمایش، برعهده این‌هاست. یعنی ضریب پردازش موازی در GPU، چندین برابر بیشتر از پردازش موازی در CPU است که سرعت آن در امور خاصی مانند پردازش تصویر را چندین چندین برابر بیشتر از CPU می‌کند اما خب باید در نظر داشته باشیم که GPU، برای محاسبات خاص طراحی شده و تفاوت اساسی آن با CPU در همین بخش است.
نمایش برنامه‌ها، ویدیوها، تصاویر، اشکال سه‌بُعدی، و اساسا هر آنچه که قابل مشاهده با چشم است، بر عهده GPU بوده که سریعتر و کارآمدتر از CPU این امور را پیش می‌برد.


انویدیا، یک هایپ‌سوار قهار

یک فکت را در ابتدای این بخش باید یادآوری کنم، و فکت این است که انویدیا علی‌رغم اینکه در ظاهر همواره پیرامون گیم و صنعت بازی‌های کامپیوتری شناخته شده؛ اما هیچ‌گاه اولویتش گیمرها و این صنعت نبوده است. چرا!؟ به نمودار زیر دقت کنید:

ارزش در بازار انویدیا از سال  ۱۹۹۹ تا ۲۰۲۴
ارزش در بازار انویدیا از سال ۱۹۹۹ تا ۲۰۲۴


نمودار بالا، مربوط به مارکت کَپ یا ارزش در بازار انویدیا را از سال ۹۹ میلادی تا به اکنون نشان می‌دهد. همان‌طور که واضح است، این نمودار یک روند ثابت و کم‌نوسان را تا اوایل سال ۲۰۱۷ نشان می‌دهد. انویدیا تا قبل از این سال، یک شرکت متوسط با فرایندی کاملا ثابت بود. اما به یکباره اوضاع تغییر کرد..
شاید روند تغییرات از اوایل سال ۲۰۱۷ و به‌خصوص در سال ۲۰۱۸ در تصویر بالا به خوبی دیده نشود، بنابر این از یک نمودار دیگر که بازه زمانی محدودتری را نشان می‌دهد استفاده می‌کنیم تا بالا و پایین‌های روند را بهتر نظاره‌گر باشیم:

می‌بینید که تغییرات ملموس‌تر شد و اوج این افزایش ارزش، مربوط به سال ۲۰۱۸ می‌شود؛ اما در این سال چه اتفاقی افتاد؟ حال به نمودار زیر دقت کنید:

ارزش در بازار ارز دیجیتال اتریوم
ارزش در بازار ارز دیجیتال اتریوم


نمودار بالا متعلق به روند ارزش‌گذاری ارز اتریوم توسط بازار است. شگفتا!
فکر کنم متوجه موضوع شدید. دلیل اینکه انویدیا از آن رکود طولانی بیرون آمد، ترندشدن ارزهای دیجیتال از سال ۲۰۱۷ بود که در سال ۲۰۱۸ به اوج خود رسید!
حال به نمودار زیر دقت کنید:

ارزش در بازار بیت کوین
ارزش در بازار بیت کوین


مجددا شگفتا!
همان‌طور که می‌بینید، روند رشد و نوسنات در ارزش‌گذاری ارز تعیین‌کننده‌ای مانند بیت‌کوین یا حتی اتریوم، چه‌قدر شبیه به نوسنات مربوط به انویدیاست!
دلیلش واضح است، انویدیا از هایپ ارزهای دیجیتال در آن بازه زمانی استفاده کرد و تعداد زیادی پردازنده مختص به ماینینگ که برای حل محاسبات پیچیده ریاضی مربوط به امر ماین، نیاز به حل محاسبات بسیار پیچیده‌ای داشت را به فروش رساند..
صعود و فرودهای ارزش انویدیا در سال‌های پیشین، مشابه اتریوم و بیت‌کوین بود اما شاید متوجه شده باشید که این روند از سال ۲۰۲۴ تغییر کرده(؟).
انویدیا پس از اتمام هایپ (منظور از هایپ در اینجا، رشد به صورت ناگهانی‌ست) اولیه ارزهای دیجیتال در سال ۲۰۱۸، دچار یک افت عجیب و غریب ارزش سهامش شد. سه ماهه ابتدایی این سال، ما آخرین رشد ارزهای دیجیتال را داشتیم که اتریوم سکان‌دار این روند صعودی به خصوص در ژانویه ۲۰۱۸ بود و در همان حوالی بود که انویدیا از کارت‌گرافیک‌های سری 20 (مثل RTX 2080) نیز رونمایی کرده بود. اما به تدریج و از ماه آوریل (یعنی ماه چهارم سال که نشان‌ می‌دهد این رشد ناگهانی چه‌قدر سریع تبدیل به افت ناگهانی می‌شود)، این رشد متوقف شد و تبدیل به یک روند نزولی گشت.
انویدیا به تبع این نزول ارزهای دیجیتال، ارزش بازار خود را در حال افت شدید دید. به همین دلیل، تصمیم گرفت تا قیمت کارت‌گرافیک‌های سری 20 خود را با چیزی نزدیک به ۸۰ تا ۹۰ درصد افزایش قیمت نسبت به سری 10، روانه بازار کند. اما باید در قبال این افزایش قیمت، یک پاسخ به مشتریان خود می‌داد.
انویدیا استفاده از فناوری‌های DLLS و Ray Tracing و چندی از این دست در کارت‌گرافیک‌های جدید را بهانه کرد.
فناوری DLLS به‌طور خلاصه، می‌تواند به کمک AI، فریم‌های بیشتری در یک تصویر تولید کند که Reflex بیشتری را در نمایش تصاویر منجر می‌شود. برای فهم بهتر، شما می‌توانید این فناوری را با رفرش‌ریت گوشی‌های خود مقایسه کنید. زمانی که رفرش‌ریت گوشی روی عدد مانند ۶۰ هرتز باشد، تصاویر را با حالتی از دیلِی یا تاخیر ناچیز نمایش می‌دهد که یک لَگ خیلی جزئی را نشان می‌دهد.
اما هر چه این مقدار رفرش‌ریت بیشتر باشد، لَگ در نمایش تصویر رو به کاهش می‌رود و در مثلا رفرش‌ریت ۹۰ یا ۱۲۰ هرتز، این میزان از لَگ یا دیلِی نمایشی، بسیار کاهش می‌یابد و تقریبا محو می‌شود.
باتوجه به این، انویدیا ادعا می‌کرد که فناوری DLLS در پردازنده‌های جدید، بهبودی مشابه آنچه برایتان توضیح دادم را به صورت خودکار در نمایش تصاویر (مانند بازی‌ها) اعمال خواهد کرد.


تفاوتی که فناوری Ray Tracing در نمایش تصاویر ایجاد می‌کند
تفاوتی که فناوری Ray Tracing در نمایش تصاویر ایجاد می‌کند


اما این Ray Tracing دقیقا چیست؟ خب می‌توانیم حتی به همین تصویر بالا نیز قناعت کنیم تا کارکرد این فناوری را توضیح دهیم. Ray Tracing یعنی فناوری محاسبه پرتوی نور در نمایش تصاویر در حالی که خود آن تصاویر این پرتوی نور را به خودی خود ندارند!
برای مثال در دنیای عادی، وقتی یک چراغ قوه را روشن می‌کنید و آن را به سمت دیوار می‌گیرید، تبعا پرتوی نور آن روی دیوار می‌افتد یا مثلا وقتی چراغ ماشین روشن است، می‌توانید پرتوی نور آن را به صورت واضح ببینید که به سمت جلو منعکس شده است. حال در نمایش تصاویر به‌خصوص در بازی‌ها، ما تصاویری را داریم که برای مثال یک جسم نورانی داخل تصویر است اما انعکاس نور پیرامون آن دیده نمی‌شود که به همین دلیل، بازی را کمتر واقع‌گرایانه جلوه می‌دهد. فناوری ذکرشده، به صورت اتوماتیک و البته جدیدا به کمک AI، محاسباتی را انجام می‌دهد تا پرتویی نوری متناسب با منبع نور ایجاد کند. هر چند که تصویر اورجینال، پرتوی نوری در آن وجود نداشته باشد! (مثل تصویر بالا که منبع نور، دو انعکاس ایجاد کرده. یکی بر روی دیوار و یکی سایه‌ای که در آب انداخته)

صرفا جهت فان :)
صرفا جهت فان :)


اما برگردیم به بحث خودمان. انویدیا به بهانه استفاده از دو تکنولوژی‌ فوق که بررسی‌شان کردیم، قیمت پردازنده‌های سری 20 را نزدیک به دوبرابر کرد. اما آیا این بهانه قابل قبول و توجیه بود؟

نمودار حاشیه سود انویدیا
نمودار حاشیه سود انویدیا


طبق تصویر بالا، می‌توانید مشاهده کنید که میزان سود انویدیا که حاصل از فروش محصولات است، نسبت به زمانی که فرایند رشد آن بدون نوسان بوده، دو تا سه برابر بیشتر شده است.
خب این چه معنایی می‌دهد؟
این یعنی هزینه تمام‌شده برای تولید هر پردازنده سری 20، تفاوت چندانی با پردازنده‌های مشابه پیشین نکرده و لذا این بهانه انویدیا مبنی بر استفاده از تکنولوژی‌های جدید مجهز به AI که برای افزایش قیمت مطرح شده بود، از درجه اعتبار ساقط است.
در واقع علت اصلی افزایش قیمت پردازنده‌های سری 20، جبران ضرر حاصل از افت محسوس بازار ارزهای دیجیتال بود که باعث کاهش تقاضا برای خرید پردازنده‌های ماینینگ نیز، شده بود.
یعنی انویدیا در فاصله تنها یک سال، پردازنده‌های پرچمدار خودش را با ۵۰۰ دلار تفاوت قیمت به فروش رساند. (سال اول و در موازات با رشد ارزش بازار ارزهای دیجیتال با قیمت ۷۰۰ دلار و سال دوم در موازات با افت ارزش بازار ارزهای دیجیتال با قیمت ۱۲۰۰ دلار)

طبق نمودار، پس از تمام هایپ اولیه ارزهای دیجیتال، شاهد هستیم که نمودار ارزش هر سهم از سهام انویدیا در بازار نیز یک روند ثابت را به خود می‌گیرد. اما اوضاع مجددا از ماه مارس ۲۰۲۰ به بعد دچار تغییرات عدیده‌ای می‌گردد. دقیقا و دقیقا، تاکید سه‌باره می‌کنم، دقیقا مشابه با فرایندی که ارزش اتریوم در بازار دارد. یعنی حتی در جزئیات نیز، این دو، مشابه هم‌دیگر در بازار به پیش‌ می‌روند.
به دو تصویر زیر دقت کنید:

بازه زمانی شروع رشد مجدد ارزش در بازار انویدیا
بازه زمانی شروع رشد مجدد ارزش در بازار انویدیا


بازه زمانی شروع رشد مجدد ارزش در بازار اتریوم
بازه زمانی شروع رشد مجدد ارزش در بازار اتریوم


بازه زمانی شروع رشد مجدد ارزش در بازار بیت‌کوین
بازه زمانی شروع رشد مجدد ارزش در بازار بیت‌کوین



همان‌طور که کاملا واضح است، بازار ارزهای دیجیتال به تدریج و از مارس ۲۰۲۰ وارد هایپ دوم خود شده و به موازات این جریان، انویدیا نیز وارد دومین موج افزایش ارزش خودش در بازار می‌شود که این بار هم میزان رشد بسیار بیشتر از بار اول است، هم طول بازه و مدت ماندن در اوج نیز بیشتر از بار قبلی‌ست و این‌بار بیش از ۱ سال (۱٫۵ سال) و به صورت نسبی، این جریان رشد ادامه پیدا می‌کند. (در مقایسه با بار پیشین که ۱ سال به طول انجامید)
دلیل اینکه نمودار اتریوم خیلی بیشتر نسبت به نمودار سایر ارزها شبیه به نمودار انویدیاست، این است که استفاده از پردازنده‌های انویدیا جهت ماین اتریوم، به‌طور محسوسی بیشتر از سایر پردازنده‌های موجود و برای سایر ارزهای موجود بود.
و اما این روند موش و گربه بازی کجا به پایان رسید؟
از اواسط سال ۲۰۲۱، رشد ارزش ارزهای دیجیتال متوقف شد و سپس تبدیل به یک روند نزولی گشت. که همان‌طور که حدس می‌زنید، مجددا باعث کاهش ارزش انویدیا نیز شد:


نمودار نزولی ارزش در بازار انویدیا از اواسط ۲۰۲۱
نمودار نزولی ارزش در بازار انویدیا از اواسط ۲۰۲۱


نمودار نزولی ارزش در بازار اتریوم در بازه زمانش مشابه با انویدیا
نمودار نزولی ارزش در بازار اتریوم در بازه زمانش مشابه با انویدیا


نمودر نزولی ارزش در بازار بیت‌کوین در بازه زمانی مشابه با انویدیا
نمودر نزولی ارزش در بازار بیت‌کوین در بازه زمانی مشابه با انویدیا


اما این بار چی شد؟ یعنی این بار هم انویدیا با بهانه استفاده از تکنولوژی‌های جدید در پردازنده‌ها، قیمت هر پردازنده را دو برابر کرد آن هم در حالی که آن فناوری‌ها کمابیش از قدیم هم با صنعت گیم و نمایش تصویر همراه بودند؟ هم بلی و هم خیر!
انویدیا این بار هم قیمت پردازنده‌ها را افزایش داد که این بار این کار را چند برابر بیشتر از دفعه قبلی انجام داد، منتها با یک دلیل متفاوت(!). دلیلی که نشان‌دهنده ناگزیربودن جریان تقاضا برای محصولی بود که انویدیا عرضه می‌کرد..

نکته: ارزش کلی سهام انویدیا در اواخر ۲۰۲۱ به بیش از ۸۰۰ میلیارد دلار هم رسید که تنها یک قدم با رسیدن به ارزش تریلیون دلاری و پیوستن به جرگه شرکت‌های تریلیون‌دلاری همچون اپل فاصله داشت، اما به دلیل افت محسوس بازار ارزهای دیجیتال، این فرصت از دست رفت:

ارزش انویدیا در نوامبر ۲۰۲۱ به ۸۲۳ میلیارد دلار رسید
ارزش انویدیا در نوامبر ۲۰۲۱ به ۸۲۳ میلیارد دلار رسید


بحران کمبود ریزتراشه‌های جهانی در پی انتشار کووید ۱۹

به‌‌قول روایتگر بی‌بی‌سی، ریزتراشه‌ها، مغزهایی تعبیه شده بر روی ساختار سیلیکونی هستند. ابتدا در سی‌پی‌یو و پردازنده‌های کامپیوتر یا گوشی‌های تلفن‌همراه، حالا اما در همه جا!
از یخچال و مایکروفر و ماشین‌لباسشویی گرفته تا کامپیوترهای شخصی، گوشی‌های تلفن‌همراه، تلویزیون‌های هوشمند و حتی خودروهای سواری همه و همه امروز حداقل یک چیپ یا تراشه درشان به کار رفته است.
اما طی یکسری حوادث درست در هنگام اوج کرونا و در سال ۲۰۲۱، تولید چیپ‌های الکترونیکی به شدت رو به کاهش رفت و در بلندمدت باعث کمبود این قطعه حیاتی در صنعت شد. از خشکسالی در تایوان گرفته (صنعت تولید چیپ یک صنعت وابسته به آب است و انرژی حاصل برای امورات تولیدی آن عمدتا به کمک آب تولید می‌شود - ۸۰ درصد زنجیره تامین تولید میکروچیپ‌های الکترونیکی به دو کشور کره‌جنوبی و بیش از آن به تایوان وابسته است) تا آتش‌سوزی در یکی از مهم‌ترین تولیدی‌های شرکت Renesas Electronics در ژاپن و البته، موج سرما و قطعی برق گسترده در ایالت تگزاس آمریکا که فرایند تولید در کارخانه‌های بزرگ صنعتی در این ایالت را عملا متوقف کرد.
در همین بلبشو، جنگ تجاری میان آمریکا و چین نیز وارد مراحل جدی‌تر خود شد. آمریکا لیستی از شرکت‌های چینی را اعلام کرد که به‌زودی تحریمشان می‌کند و شرکت چینی Huawei در واکنش به این رخداد، قبل از اینکه موعد تحریم‌ها فرا برسد؛ حجم عظیمی از تراشه را سفارش می‌دهد که ظرفیت تولید جهانی را تحت تاثیر این اتفاق قرار می‌دهد و به مرور بازار از چیپ، خالی می‌شود!
این در حالی بود که مثلا در صنعت خودروسازی، هر خودروی بنزینی یا دیزل به صورت میانگین نیاز به ۵۰ تا ۲۰۰ ریزتراشه دارد و خودروهای برقی و هیبریدی نیز گاها تا چند هزار ریزتراشه را در ساختار خود طلب می‌کنند.
و دقیقا به همین دلیل بود که در همان دوران (سال‌های ۲۰۲۱ و ۲۰۲۲)، صنعت خودروسازی هم با بحران مواجه شد و شرکت‌های بزرگی همچون تویوتا یا فولکس‌واگن مجبور به کاهش ظرفیت تولید یا حتی توقف تولید برخی از محصولاتشان شدند.
اسکات کیو در آن سال اذعان کرد که شیفت کاری فولکس‌واگن از ۳ شیفت، به‌ناچار به ۲ شیفت کاهش می‌یابد. و باز در عین تمامی این رخدادهای سریالی، باوجود همه‌گیری ویروس کرونا و باتوجه به افزایش اوقات فراغت به واسطه قوانین منع آمدوشد در اماکن، تقاضا برای کنسول‌های بازی نیز افزایش یافت.
بخواهیم از دید کلی‌تر نگاه کنیم؛

خودروسازان با این فرض که مردم در دوران همه‌گیری ویروس کرونا، رفت‌وآمد کمتری را به علت قوانین منع آمدوشد خواهند داشت. تولید خودروهای جدید را کاهش دادند. این باعث کاهش سهم خودروسازان از بازار میکروچیپ‌ها شد. این بخش خالی در بازار میکروچیپ اما توسط صنعت دیگری به نام صنعت تولید کنسول‌های بازی پر شد. در نتیجه وقتی خودروسازان پس از کاهش همه‌گیری، بار دیگر خواستند ظرفیت تولید را افزایش داده و به حالت قبل برگردانند؛ شوکه شدند!
زیرا اولویت سفارشات میکروچیپ برای شرکت‌های خودروسازی هم به دلیل حجم کم سابق و هم به دلیل زمان سفارشات، در اولویت پایین‌تری نسبت به شرکت‌های تولید کنسول‌های بازی قرار گرفت و عملا برندهای کنسول بازی همانند XBOX و PlayStation که به ترتیب وابسته به شرکت‌های مایکروسافت و سونی بودند، جای خودروسازان را گرفتند.





واکنش انویدیا به بحران جهانی کمبود ریزتراشه

خب حدس این مورد هم کار سختی نیست، انویدیا دو سری پردازنده سطح‌بالای خودش را در فاصله تنها یک سال، مجددا با اختلاف قیمتی ۵۰۰ دلار قیمت‌گذاری کرد. (از ۱۰۰۰ دلار رسید به نزدیک ۱۵۰۰ دلار)
این اتفاق با رونمایی از پردازنده‌های سری 30 تشدید شد اما همه ماجرا به اینجا ختم نمی‌شود. با تداوم بحران کمبود ریزتراشه، ارزش برخی از پردازنده‌های سری 30 انویدیا تا ۴۵۰۰ دلار هم افزایش پیدا کرد که نسبت به قیمت‌گذاری اولیه، قیمت به‌شدت زیاد و بی‌سابقه‌ای بود.
از طرف دیگر، پیداکردن این‌چنین پردازنده‌ها در بازار در یک بازه زمانی قابل‌توجه تقریبا غیرممکن شده بود و سفارشات کامپیوترهای شخصی یا قطعات سخت‌افزاری همچون کارت گرافیک که پیش از این با تاخیر نهایتا ۳ روزه در فرایند تحویل، به دست مشتریان مذکور می‌رسیدند؛ در جریان کمبود ریزتراشه با تاخیر گاها چند ماهه به دست مشتریان می‌رسیدند که در نوع خود بی‌سابقه بود.
به موازات این، افراد کارت‌گرافیک‌های خود را در ebay و امثال آن با قیمت‌های عجیب و غریب آگهی می‌کردند که برای مثال این قیمت‌ها تا ۱۵۰هزار دلار در برخی بازه‌های زمانی نیز می‌رسید! (مانند پردازنده RTX 3080)
اینجا انویدیا یک بار دیگر ثابت کرد که اصلا به فکر جامعه گیمر و بازی‌کن (بازی = گیم) نیست و اولویت برای این شرکت، حاشیه سود بیشتر است.
در واقع دلیل این افزایش قیمت که در عین حال موجب کاهش تقاضا نشد و فرایند بازار را به کل به هم ریخت، شکل‌گیری یک شبهِ‌مونوپولی توسط انویدیا در بازار تولید پردازنده‌های گرافیکی بود. زیرا هیچ شرکت دیگری توان رقابت با انویدیا در آن سطح از تولید روزانه و سرعت در پیشرفت تکنولوژی و توان پردازشی را، تاکنون نداشته و احتمالا طی سال‌های آتی نیز نخواهد داشت.
با این‌حال انویدیا باز هم بعد از افت ارزش بازار ارزهای دیجیتال، چیزی بیش از ۵۰۰ میلیارد دلار از ارزش خودش را از دست داد که یک عدد وحشتناک زیاد در این مقیاس از تولید است:

ارزش سهام انویدیا از ۸۲۳ میلیارد دلار تا ۲۷۸ میلیارد دلار هم افت کرد
ارزش سهام انویدیا از ۸۲۳ میلیارد دلار تا ۲۷۸ میلیارد دلار هم افت کرد


اما و اما، بعد از پایان بحران کمبود ریزتراشه چه اتفاقی افتاد؟ چه شد که انویدیا هنوز که هنوزه، نه‌تنها طبق پیش‌بینی خیلی از تحلیلگران، سقوط نکرده؛ بلکه ارزش سهام آن به بیشترین مقدار تاریخ خود رسیده و نه‌تنها وارد جرگه شرکت‌های تریلیون‌دلاری همچون اپل و مایکروسافت شده، که شرکت بزرگ، چندملیتی و نفتی آرامکو را نیز اخیرا پشت سر گذاشت و وارد دوره جدیدی از حیات خود شد!؟


داده طلاست و انویدیا بیل‌فروش! (یک زمانی نفت طلا بود و آرامکو نفت‌فروش)
داده طلاست و انویدیا بیل‌فروش! (یک زمانی نفت طلا بود و آرامکو نفت‌فروش)



هایپ هوش مصنوعی

طبق تصویر بالا و البته یادآوری تصویر نمودار ارزهای اتریوم یا بیت‌کوین، متوجه می‌شوید که ارزش سهام انویدیا، کمابیش همچنان تا سال ۲۰۲۳ به موازات و هماهنگ با ارزش بازار ارزهای دیجیتال پیش می‌رفت و البته تحت تاثیر بحران کمبود ریزتراشه نیز بود. با این حال از اواسط ۲۰۲۳ به بعد، برای اولین بار در سال‌های اخیر، وابستگی به نمودار ارزهای دیجیتال را درهم می‌شکند و رشد عجیب و غریب تازه‌ای را تجربه می‌کند.
این رشد جدید ناشی از یک هایپ‌سواری جدید با یک هایپ تازه‌نفس است(!)؛ یعنی هوش مصنوعی.
حال زمان خدمات‌دهی به بازیگران جدید عرصه بازار بود. به‌طور مثال، کمپانی OpenAI که احتمالا معرف حضور شماست، برای آموزش یا ترین (Train) اولیه ChatGPT، تعداد ۱۰هزار پردازنده سری H100 شرکت انویدیا را با قیمت متوسط بین ۱۰ تا ۲۰هزار دلار سفارش داد که اگر قیمت هر پردازنده را به‌صورت میانگین، ۱۵هزار دلار در نظر بگیریم؛ در مجموع به عدد ۱۵۰میلیون دلار خواهیم رسید.
اما شرکت openAI تنها شرکت خریدار محصولات انویدیا نیست، شرکت مادر آلفابت که در واقع بهتر است از آن به عنوان همان گوگل یاد کنیم نیز به‌طور گسترده از پردازنده‌های ساخت انویدیا استفاده می‌کند و هنوز موفق نشده که پردازنده‌های خودش یعنی TPUها را به سطحی از کارکرد و کارایی برساند که بتواند منحصرا فقط از آن‌ها برای انجام امورات خود استفاده کند. (TPU یا Tensor Processing Unit بر وزن CPU یا GPU، یک سیستم پردازشی خاص دیگر هست که برای اجرای سریعتر الگوریتم‌های یادگیری‌ماشین و یادگیری‌عمیق که توسط گوگل و اولین بار در سال ۲۰۱۶ معرفی شده که هنوز به کارایی و کاربرد گسترده پردازنده‌های انویدیا نرسیده است و یکی از انبوه طرح‌های ناموفق و زیان‌ده گوگل در سال‌های اخیر می‌باشد - گوگل در محصولاتی همچون گوگل کلود یا گوگل کولب از این پردازنده‌ها استفاده می‌کند)
از طرف دیگر کمپانی خودروسازی تسلا که معرف حضورتان است، در سال قبل تعداد ۵۷۶۰ پردازنده A100 انویدیا را سفارش داد که هزینه کلی آن، مجموعا معادل با حدود ۵۷میلیون دلار بوده است.
یا کمپانی مادر متا (صاحب اینستاگرام و فیسبوک) در دو سال قبل، تعداد ۲۲هزار پردازنده مدل V100 انویدیا را خریداری کرده که مجموعا نزدیک به ۴۵۰میلیون دلار برای این کمپانی هزینه داشته است.
ارزش کلی شرکت انویدیا در سال ۲۰۱۶ تنها و تنها ۱۰میلیارد دلار بود اما در حال حاضر ارزش این کمپانی، به ۲تریلیون و ۲۵۰میلیارد دلار رسیده و بعد از مایکروسافت (که خود مایکروسافت هم از هایپ هوش مصنوعی و به لطف OpenAI کلی سود کرده) و اپل، سومین کمپانی ارزشمند کل دنیاست و حالا حتی آرامکو را هم پشت سر خود می‌بیند! (برای محاسبه درصد رشد ارزش کل انویدیا از سال ۲۰۱۶ تا سال ۲۰۲۴، از فرمول زیر استفاده می‌کنیم: درصد رشد = ((ارزش فعلی - ارزش اولیه) / ارزش اولیه) * 100
با جایگذاری ارقام مربوطه، نتیجه می‌شود:

((۲٫۲۵۰٫۰۰۰٫۰۰۰٫۰۰۰ - ۱۰٫۰۰۰٫۰۰۰٫۰۰۰) / ۱۰٫۰۰۰٫۰۰۰٫۰۰۰) * ۱۰۰ = ۲۲٫۴۰۰%

بنابراین، ارزش کل انویدیا در طول ۸ سال، حدود ۲۲٫۴۰۰% رشد کرده است. به عبارت دیگر، ارزش کل آن حدود ۲۲۴ برابر بزرگتر شده که میزان خیره‌کننده‌ای در نوع خودش محسوب می‌شود.
همچنین این کمپانی تا به اینجای سال ۲۰۲۴، حدود ۶۰میلیارد دلار درآمد داشته که اگر این‌ مقدار را از هزینه‌های تولید (۲۷میلیارد دلار هزینه تولید برآورد شده است) به عدد ۳۳ میلیارد دلار می‌رسیم که اگر باز از این مقدار نیز، هزینه‌های مالیاتی و امثالهم (۳میلیارد دلار) را نیز کم کنیم؛ در نهایت به سود خالص معادل با حدود ۳۰ میلیارد می‌رسیم که که عدد قابل توجهی آن هم فقط برای ۳ ماه به نظر می‌رسد.



بخش دوم - بررسی رویداد GTC 2024


جنسن هوانگ در کنفرانس امسال که 18 مارچ برگزار شد نیز مانند سابق حضور داشت
جنسن هوانگ در کنفرانس امسال که 18 مارچ برگزار شد نیز مانند سابق حضور داشت


سوپرایزهای جدید انویدیا

  • پردازنده‌های سری Blackwell (B100, B200, GB200 &..)
    قبل از هر چیز، انویدیا باید خود را به عنوان پیشرو در فناوری GPU با سخت افزار پیشرو نشان دهد. به همین دلیل انویدیا خانواده محصولات Blackwell را معرفی کرد که از یک GPU واحد تا یک مرکز داده کامل از پردازنده‌های گرافیکی مرتبط با فناوری Mellanox InfiniBand انویدیا که شرکت مربوط به آن را در سال ۲۰۱۹ خریداری کرد، قابل پیاده‌سازی و افزایش مقیاس هستند. سیستم های مقیاس‌بالا (Hyperscale) با میزان تاخیر کم و پهنای باند بالا.
    پردازنده گرافیکی بلکول 208B ترانزیستوری، درواقع دارای تعداد بسیار زیادی ترانزیستور، تقریباً 208 میلیارد ترانزیستور، روی یک تراشه است. (امکان پیاده‌سازی این تعداد ترانزیستور فقط بر روی تراشه‌های نیمه‌هادی امکان‌پذیر است) این تراشه دو پردازنده گرافیکی 104B ترانزیستوری را در خود ترکیب می‌کند. هر دو نوع B100 و B200 بلکول، همچنین، حافظه‌ای به نام HBM3E دارند که باعث فراهم کردن عملکرد بالا و پهنای باند بالا در سیستم‌های الکترونیکی و کامپیوتری می‌شود. این حافظه با استفاده از یک مسیر ۴۰۹۶ بیتی و پهنای باند حافظه ۸ ترابایت بر ثانیه، داده‌ها را با سرعت بالا انتقال می‌دهد. همچنین، حافظه VRAM به میزان ۱۹۲ گیگابایت نیز در این پردازنده‌ها وجود دارد.
    (حافظه VRAM (Video Random Access Memory) یک نوع حافظه خاص هست که در کارت‌های گرافیک استفاده می‌شود. این حافظه برای ذخیره و دسترسی سریع به داده‌های تصویری و ویدیویی مورد استفاده قرار می‌گیرد. از طرف دیگر برای نمایش تصاویر و ویدئوها بر روی صفحه نمایش استفاده می‌شود. زمانی که تصویری روی صفحه نمایش، به نمایش در می‌آید؛ داده‌های مربوط به آن تصویر در حافظه VRAM ذخیره می‌شوند. این حافظه به عنوان یک حافظه از نوع RAM عمل می‌کند، به این معنی که داده‌ها به صورت تصادفی و در لحظه می‌توانند از حافظه خوانده یا بر روی آن نوشته شوند)
    هر دو GPU مذکور از پهنای باند ۱۸۰۰ گیگابایت بر ثانیه NVLink 5 و همچنین PCIe 6.0 پشتیبانی می کنند.
    (NVLink 5 یک فناوری ارتباطی پیشرفته است که برای ارتباط مستقیم بین دو پردازنده گرافیکی استفاده می‌شود. این فناوری برای افزایش پهنای باند ارتباطی بین دو پردازنده و به اشتراک گذاری داده‌های بین آن‌ها استفاده می‌شود. با کمک این فناوری، پهنای باند ارتباطی می‌تواند تا ۱۸۰۰ گیگابایت بر ثانیه برسد. به این ترتیب، این دو پردازنده می‌توانند به صورت موثر با یکدیگر کار کنند و در کارهایی که نیاز به قدرت پردازش بالا و ارتباط موثر بین گرافیک‌ها دارند، عملکرد بهتری ارائه دهند.
    این دو همچنین از PCIe 6.0 پشتیبانی می‌کنند. PCIe 6.0 (Peripheral Component Interconnect Express) یک استاندارد ارتباطی است که برای اتصال قطعات سخت‌افزاری به مادربورد استفاده می‌شود. با استفاده از PCIe 6.0، پهنای باند ارتباطی بین پردازنده گرافیکی و سایر قطعات سیستم مانند CPU و RAM، به صورت چشمگیری افزایش می‌یابد. این باعث می‌شود که داده‌ها باسرعت بیشتری بین اجزای سیستم جابه‌جا شوند و عملکردشان بهبود یابد.



دو پردازنده گرافیکی (GPU) مذکور، یعنی B100 و B200، با استفاده از فناوری تولید ۴ نانومتری به نام
4NP TSMC (بد نیست بدانید که شرکت Taiwan Semiconductor Manufacturing Company مشهور به TSMC بزرگ‌ترین تولیدکننده‌ی مستقل محصولات نیمه‌هادی در جهان محسوب می‌شود که مرکز فعالیت آن در تایوان و پارک علوم و صنعت شهر سینچو قرار دارد - این کمپانی در حال حاضر، ۱۰مین کمپانی ارزشمند در دنیاست) تولید می‌شوند. این فناوری تولید به ساختاری دقیق برای اجزای آنها اشاره دارد.
بخش مهمی که باید در نظر گرفته شود، توان مصرفی این دو GPU است. B100 با توان مصرفی ۷۰۰وات و B200 با توان مصرفی ۱ کیلووات برق معرفی شده‌اند. باید توجه داشته باشید که این توان مصرفی مربوط به عملکرد کامل آنهاست. (عملکرد کامل توان مصرفی یک دستگاه یا قطعه به معنای مصرف تمام توان مشخص شده برای آن است. به عبارت دیگر، زمانی که یک دستگاه در حال اجرای کارهای خود است و تمام قابلیت‌ها و عملکردهای آن به حداکثر خود می‌رسد، توان مصرفی آن به حداکثر مقدار تعیین شده برای آن واحد می‌رسد.)
انویدیا B100 را به عنوان جایگزینی برای مدل H100 طراحی کرده. این بدین معناست که توان مصرفی آن با H100 برابر هست. (۷۰۰وات)
با این حال، B100 تقریباً ۸۰٪ سریعتر از H100 کار می‌کند که نشان می‌دهد که معماری Blackwell انویدیا در مقایسه با معماری Hopper (معماری که در پردازنده‌های H100 به کار رفته) دارای سرعت بیشتری است. بنابراین، B100 در کارایی خود حدوداً ۸۰٪ بهبود داشته و سرعت بیشتری را ارائه می‌دهد.
به طور مشابه، B200 در اکثر سناریوها بیش از ۱۰٪ سریعتر است. این به این معنی‌ست که در کارایی خود حدوداً ۱۰٪ بهبود دارد و سرعت بیشتری نسبت به B100 ارائه می‌دهد.


سوپرتراشه GB200
سوپرتراشه GB200


  • سوپرتراشه GB200 (Grace Blackwell)
    سوپرتراشه GB200 یک ترکیب از دو پردازنده گرافیکی B200 و یک CPU سرور Grace Arm است. این سوپرتراشه با استفاده از اتصالات NVLink با پهنای باند ۹۰۰ گیگابایت بر ثانیه، پردازنده گرافیکی B200 را به CPU سرور متصل می‌کند.
    انویدیا درباره GB200 ادعا می‌کند که عملکرد تانسور FP4 آن 20 PFLOPS است (با پراکندگی 40 PFLOPS). این به معنای داشتن عملکردی بیش از دو برابر یک B200 معمولی است. همچنین، GB200 دارای ۳۸۴ گیگابایت حافظه HBM3E است. (تانسور (Tensor) در علم ریاضیات و علوم کامپیوتر به معنای یک مفهوم چندبعدی و چندمقداره است. در واقع، تانسور می‌تواند به عنوان مجموعه‌ای از اعداد، مقادیر یا مجموعه‌ها در فضای چندبعدی تعریف شود - در زمینه یادگیری عمیق و شبکه‌های عصبی، تانسورها نقش بسیار مهمی ایفا می‌کنند. در این حوزه، داده‌ها به صورت تانسورها مدل می‌شوند و عملیات ریاضیاتی بر روی آنها انجام می‌شود. به عنوان مثال، تصاویر در شبکه‌های عصبی به صورت تانسورهای چندبعدی با ابعاد عرض، طول و عمق مدل می‌شوند)
    این سوپرتراشه ترکیبی حاوی بیش از ۴۹۶ میلیارد ترانزیستور است. هر یک از قالب‌های بلک‌ول دارای ۱۰۴ میلیارد ترانزیستور هستند و چهار عدد از این قالب‌ها همراه با یک تراشه سرور ۸۰ میلیارد ترانزیستوری گریس در هر سوپرتراشه قرار دارند.
    توان مصرفی GB200 برابر با ۲۷۰۰وات است و به دو نوع ارائه می‌شود، یک نوع برای نصب در رَک‌ها (به محفظه‌های نگهداری سرورها Rack گفته می‌شود) و دیگری برای سیستم‌های DGX/HGX فشرده‌تر.
اتصالات NVLink یک رابط ارتباطی پیشرفته است که توسط شرکت NVIDIA برای ارتباط بین کارتهای گرافیکی (GPU) طراحی شده است. NVLink امکان انتقال داده‌ها و اشتراک منابع سیستمی بین گرافیک‌ها را فراهم می‌کند.


همچنین، یک رابط با پهنای باند بسیار بالا است که بین GPU‌ها قرار می‌گیرد و اجازه می‌دهد تا اطلاعات با سرعت بسیار بالا و بازدهی بالا بین GPUها منتقل شود. اتصال NVLink می‌تواند عملکرد سیستم‌های چند گرافیکی را بهبود بخشد.
با استفاده از این رابط، GPUها می‌توانند به طور مستقیم با یکدیگر ارتباط برقرار کنند و اطلاعات را بین خود به اشتراک بگذارند. این ارتباط می‌تواند برای اجرای عملیات موازی و هماهنگی بین کارت گرافیک‌ها استفاده شود، که در نتیجه، عملکرد و قدرت پردازشی سیستم را افزایش می‌دهد.
علاوه بر این، NVLink امکان اتصال GPU به سایر دستگاه‌هایی مانند پردازنده‌های مرکزی (CPU) و حافظه‌های فوق‌العاده سریع را فراهم می‌کند. این اتصالات پیشرفته می‌توانند بهبود قابل توجهی در عملکرد و کارایی سیستم‌های پردازش موازی و پرسرعت ایجاد کنند که نیازمندی اولیه مدل‌هایی همچون ChatGPT برای اجرا هستند.
با استفاده از NVLink، کارت‌های گرافیکی GB200 می‌توانند به یک رک کامل متصل شوند. NVIDIA این سیستم را GB200 NVL36 و NVL72 نامیده است. NVL36 شامل ۳۶ تراشه B200 و ۱۸ گره محاسباتی برای هر یک تراشه GB200 است. NVL72 نیز دارای ۱۸ تراشه GB200 دوتایی است.
این سیستم از نسل پنجم سوئیچینگ NVLink برای اتصال کارت‌های گرافیکی در رک استفاده می‌کند. NVIDIA ادعا می‌کند که این سیستم توانایی انجام محاسبات استنتاجی FP4 به میزان 1.33 exaFLOP را دارد. این مقدار بسیار بزرگ است و در مقایسه با نیاز سال‌های گذشته برای دستیابی به یک exaFLOP، به طور قابل توجهی بیشتر است.
اما منظور از محاسبات استنتاجی چیست؟ بذارید این مبحث را کمی باز کنیم:

محاسبات استنتاجی:
محاسبات استنتاجی به فرایندی اطلاق می‌شود که در آن، الگوریتم یادگیری ماشین یا سیستم هوش مصنوعی از داده‌های ورودی استفاده می‌کند تا نتیجه‌گیری کرده و پاسخ‌های مورد نیاز را نیز، تولید کند. به عبارتی دیگر، در این حالت، سیستم از مدل‌های یادگیری عمیق (Deep Learning) استفاده می‌کند تا عملکرد خود را در تشخیص الگو و تصمیم‌گیری بهبود بخشد.
سیستم محاسباتی FP4:
FP4 مخفف یک فرآیند محاسباتی با دقت محاسباتی ۳۲بیت است. این به این معنی است که در این فرآیند، عملیات محاسباتی با استفاده از اعداد حقیقی ۳۲بیتی (floating-point) انجام می‌شود.
واحد محاسباتی exaFLOP:
exaFLOP یک واحد سرعت محاسباتی است که به معنای انجام یک کوادریلیون (۱۰ به توان ۱۸) عملیات محاسباتی در ثانیه است. به عبارت دیگر، سطح بسیار بالایی از قدرت محاسباتی‌ست که در مقیاس بسیار بزرگی انجام می‌شود.
بنابراین، سیستم GB200 NVL36 و NVL72 قادر به انجام محاسبات استنتاجی با سرعت ۱.۳۳ exaFLOP است. این بدین معناست که سیستم قادر است در هر ثانیه، ۱.۳۳ کوادریلیون عملیات محاسباتی را به صورت استنتاجی با دقت ۳۲بیت انجام دهد. این سرعت بسیار بالا و توانمندی قابل توجهی در عملکرد محاسباتی را نشان می‌دهد و همچنین نشان دهنده قدرت سیستم در پردازش و تصمیم‌گیری‌های بسیار پیچیده نیز می‌باشد. (آنچه که ما از هوش مصنوعی انتظار داریم)

در عین‌حال که معماری بلکول، اشتهای سیری‌ناپذیر انویدیا به قدرت‌نمایی و نمایش توان محاسباتی بسیار زیاد پردازنده‌های خود را نشان می‌دهد، اما با این‌حال، در صرفه جویی در اشغال فضا و مصرف انرژی هم بسیار موثر عمل کرده است.
این به‌ویژه برای مشتریانی اهمیت دارد که قائل به استفاده هدفمند و ازپیش‌ تعیین شده از توان پردازشی پردازنده‌ها هستند.
برای مثال، انویدیا در مورد آموزش یک مدل GPT-MoE با ۱.۸ تریلیون پارامتر صحبت کرده است. برای آموزش این مدل با استفاده از پردازنده‌های گرافیکی Hopper جدید خود، به ۸۰۰۰ عدد پردازنده GPU و ۱۵ مگاوات برق در حدود ۹۰ روز احتیاج دارد.
اما در مقابل، اگر سیستم بلکول GB200 NVL72 بخواهد همان مدل ۱.۸ تریلیون پارامتری را آموزش دهد، تنها به ۲۰۰۰ پردازنده گرافیکی و ۴مگاوات نیرو در همان بازه زمانی نیاز دارد. این نکته بسیار مهمی‌ست، زیرا نشان می‌دهد قدرت محاسباتی در حال تبدیل شدن به یک نقطه کانونی و تعیین کننده از حیث اهمیت، در امر محاسبات هوش مصنوعی و بر بستر کلود است.


  • هوش مصنوعی مولد (Generative AI) و (Nvidia Inference Microservice) NIM
    به عنوان یک شرکت پیشرو در بازار مربوط به هوش مصنوعی، انویدیا باید اطمینان حاصل کند که می‌تواند به سرعت به انتشار خدمات و برنامه‌های هوش مصنوعی با کیفیت بیشتر و به صورت بهینه‌تر کمک کند. یکی از راه‌های دستیابی به این هدف، حصول اطمینان از بهینه‌سازی تمامی مدل‌های جدید هوش مصنوعی برای سخت‌افزارهای انویدیاست.
    به عبارت دیگر، پیاده‌سازی این مدل‌ها برای توسعه‌دهندگان باید تا جای ممکن ساده‌تر شود. به همین دلیل، انویدیا به تازگی کاتالوگ جدیدی از خدمات مایکروسرویس NIM و اندپوینت‌های کلود برای مدل‌های پیش‌آموزش‌دیده هوش مصنوعی با بهینه‌سازی برای GPUهایی که از CUDA (یک مدل برنامه‌نویسی که توسط انویدیا معرفی شده) پشتیبانی می‌کنند، معرفی کرده است. شرکت‌ها می‌توانند از این خدمات مایکروسرویس NIM برای مجموعه‌ای از قابلیت‌ها، شامل سفارشی‌سازی LLM (مدل‌های زبانی همچون ChatGPT)، استنتاج، تولید محتوا با استفاده از روش نسخه افزایش‌یافته محتوا به وسیله بازیابی (با عرض پوزش اما اکثر مترجمان حوزه فناوری، دهنشان سر ترجمه این عبارت که در ادامه می‌گویم سرویس شده است فلذا کسی این عبارت را ترجمه نمی‌کند، بلکه توضیحش می‌دهد یا برای فهم بهتر آن، مثال می‌زند!) یا همان retrieval-augmented generation) RAG) و پیاده‌سازی هر چه بهتر کنترل‌های امنیتی استفاده کنند.
    (به عنوان مثال، در حوزه تولید متن، مدل بازگشتی می‌تواند یک جمله یا پاراگراف جدید را براساس اطلاعات دریافتی از سیستم بازیابی تولید کند. این اطلاعات می‌تواند شامل جملاتی باشد که در پاسخ به یک سوال خاص، توسط سیستم بازیابی استخراج شده‌اند - ساده‌تر بخواهیم بگوییم، فرض کنید که شما از جی‌پی‌تی می‌پرسید پایتخت فرانسه کجاست؟ بدون RAG صرفا به شما می‌گوید "پاریس، پایتخت فرانسه است" اما با استفاده از RAG، شروع به استدلال و آوردن دلیل و مدرک برای ادعای خود می‌کند. یعنی این طور پاسخ می‌دهد: "پایتخت فرانسه پاریس است. این شهر در شمال کشور واقع شده است و جمعیت آن حدود دو میلیون نفر است")
در دنیای IT، منظور از اندپوینت یا Endpoint، هر دیوایس یا دستگاه متصل به شبکه هست که قابلیت استفاده از منابع اشتراکی شبکه را داشته باشد. اما در اینجا به مفهوم یک آدرس وب است که توسعه‌دهندگان برای کاربردهای خاص مدنظرشان باید به سمت آن درخواست ارسال کنند. (مثل src.data/services)



  • برنامه همکاری جدید با مدیاتک
    مدیاتک (MediaTek) یک شرکت فناور تایوانی‌ست که در سال ۱۹۹۷ تأسیس شده است. این شرکت به طور عمده در زمینه طراحی و تولید تراشه‌های نیمه‌هادی (semiconductor)، سیستم‌های کامپیوتری و ارتباطاتی فعالیت می‌کند. محصولات اصلی مدیاتک شامل پردازنده‌های مرکزی (CPU)، پردازنده‌های گرافیکی (GPU)، گیرنده‌های رادیویی(RF) بی‌سیم، تراشه‌های مودم و سیستم‌های تراشه‌ای برای دستگاه‌های هوشمند و دستگاه‌های مبتنی بر اینترنت اشیا است.
    در رویداد GTC 2024، انویدیا و مدیاتک فاز بعدی همکاری خود در حوزه خودرو را اعلام کردند.
    Dimensity Auto Cockpit (یک تراشه مخصوص خودروهای هوشمند که توسط مدیاتک توسعه داده شده است) ترکیبی از قابلیت‌های ساخت SoC (کلمه SoC مخفف "System on a Chip" است و به تراشه‌هایی اشاره دارد که تمامی مجموعه قطعات و اجزای یک سیستم کامپیوتری را در یک تراشه یکپارچه کرده‌اند. در واقع، SoC یک تراشه یکپارچه است که شامل پردازنده‌ها، حافظه، رابط‌ها، واحدهای ورودی و خروجی (I/O)، و سایر قطعات مورد نیاز برای اجرای یک سیستم کامل است) مدیاتک و GPUهای انویدیا که با Drive OS (سیستم‌عامل مختص به خودروهای هوشمند) اجرا می‌شوند، است. همچنین، مدیاتک چهار محصول جداگانه با فناوری ۳ نانومتری را معرفی کرد که از آن‌جایی که خارج از بحث فعلی ماست؛ از بررسی آن صرفه نظر می‌کنیم.
سیستم Drive OS از یک معماری پردازش چند هسته‌ای استفاده می‌کند که می‌تواند به صورت همزمان، بخش‌های مختلفی از خودرو را کنترل کند. این سیستم عامل همچنین از لایه‌های نرم‌افزاری متنوعی برای پردازش داده‌ها، شناسایی و تشخیص اشیا، کنترل خودرو، ارتباطات بی‌سیم و بسیاری از وظایف دیگر پشتیبانی می‌کند.

تراشه‌های Dimensity Auto Cockpit شامل یک پردازنده Arm v9-A به همراه یک GPU انویدیا به نام،
"next-gen" برای استفاده از هوش مصنوعی (AI) و گرافیک RTX درون خودرو هستند. همچنین یک ISP که دارای چند دوربین HDR هست، برای کارکردهای مبتنی بر دوربین، که خودروها در آینده نیاز خواهند داشت، وجود دارد. همچنین یک DSP صوتی یکپارچه برای استفاده از قابلیت دستیار صوتی جدید و برای تجربه پردازش زبان طبیعی پویا را فراهم می‌کند. عملکرد دقیق هوش مصنوعی در این تراشه‌ها هنوز مشخص نیست، اما به نظر می‌رسد هوش مصنوعی، نقطه اصلی اتصال دو کمپانی برای انعقاد قراردادهای همکاری جدید است.

همچنین، MediaTek پشتیبانی از سیستم عامل‌های QNX، Linux و Android Automotive را ارائه خواهد داد. این یک بستر مناسب برای مشتریان بالقوه Nvidia مانند BYD (یک شرکت خودروسازی چینی) است، که به تازگی تبدیل به تولیدکننده شماره یک خودروهای الکتریکی در جهان شده است. اگرچه به نظر می‌رسد که طرح‌های اولیه MediaTek توسط شرکت‌های چینی مانند Geely، NIO، SAIC Motor و XPeng نیز مورد استفاده قرار خواهد گرفت؛ اما احتمالا پیشرفتهای بعدی می‌تواند باعث جذب سایر شرکت‌های OEM (شرکت‌های سازنده قطعات مانند جنرال موتورز یا PACCAR) برای MediaTek و Nvidia شود.



  • توسعه Omniverse و Vision Pro
    Omniverse یک پلتفرم نرم‌افزاری متعلق به خود شرکت Nvidia هست که برای ساخت و به اشتراک گذاری محتوا و تجربه‌های واقعیت مجازی، ترکیبی و افزوده، طراحی شده است. این پلتفرم امکان همکاری و تعامل بین برنامه‌ها و ابزارهای مختلف را در محیط‌های سه بعدی فراهم می‌کند.
    با استفاده از Omniverse، کاربران می‌توانند مدل‌های سه بعدی را در اشکال مختلف طراحی کرده، به اشتراک بگذارند و در محیط‌های واقعیت مجازی و ترکیبی تجربه کنند.
    Omniverse بر اساس چارچوب Universal Scene Description (USD) که توسط Pixar توسعه داده شده است، ساخته شده. این چارچوب به کاربران امکان می‌دهد مدل‌ها، تنظیمات و اطلاعات صحنه را در یک فرمت قابل توسعه و تغییرپذیر، ذخیره و به اشتراک بگذارند. Omniverse همچنین از تکنولوژی ردیابی نوری RTX (ردیابی نوری یا Ray Tracing را پیشتر توضیح دادیم. اما به‌طور خلاصه، فناوری بود که در تصاویری که یک منبع نورانی را به تصویر می‌کشیدند، حالت انعکاس آن نور بر اشیای پیرامون را به صورت خودکار و بدون نیاز به داشتن انعکاس اولیه، ایجاد می‌کرد) استفاده می‌کند که توسط Nvidia توسعه داده شده و به کاربران امکان می‌دهد تا بازی‌ها و تجربیات واقعیت مجازی با کیفیت بالا و ترسیم نور واقع‌گرایانه را تجربه کنند.
    از جمله کاربردهای Omniverse عبارت‌اند از، تولید فیلم‌ها و انیمیشن‌های سه بعدی، طراحی واقع‌گرایانه پروتوتایپ یا موکاپ محصولات(مناسب مدیرمحصول‌ها)، مدل‌سازی معماری و شهرسازی، شبیه‌سازی فیزیکی و مهندسی (مانند نرم‌افزارهای شبیه‌سازی شتاب‌دهنده‌ها همچون LucidShape) ، و همچنین تجربه‌های واقعیت مجازی و ترکیبی در صنایع مختلف مانند بازی‌های ویدئویی و طراحی خودرو.
    برای Nvidia ، پلتفرم Omniverse یک ابزار قدرتمند برای بسیاری از کاربردهاست. در رویداد GTC ، انویدیا، به طور مختصر و با جزئیات بسیار کم اعلام کرد که از پوشاک Vision Pro شرکت Apple در Omniverse پشتیبانی خواهد کرد. ما فقط می‌توانیم فرض کنیم که منظورشان، استفاده از قابلیت فریم‌ورک سه‌بُعدی USD و هر دوی Omniverse و Apple Vision Pro خواهد بود. همچنین Nvidia اعلام کرد که زین‌پس با شرکت Siemens همکاری خواهد داشت تا از طریق رابط‌های برنامه نویسی (API)، پلتفرم Xcelerator را بر روی پلتفرم ابری پشتیبانی کند.
    Xcelerator یک پلتفرم نرم‌افزاری از شرکت Siemens است که طراحی شده تا فرایندهای مهندسی و تولید در صنایع مختلف را پشتیبانی کند. این پلتفرم شامل مجموعه‌ای از ابزارها، برنامه‌ها و سرویس‌های متنوع است که به شرکت‌ها کمک می‌کند فرایندهای خود را بهینه سازند و بهبود بخشند.
    Xcelerator امکاناتی را در زمینه‌های طراحی مهندسی، شبیه‌سازی، تحلیل، تولید و مدیریت فرایندهای تولید ارائه می‌دهد. این پلتفرم قابلیت‌هایی نظیر مدل‌سازی سه بعدی، شبیه‌سازی مجازی، طراحی و تحلیل محصول، بهینه‌سازی فرایندهای تولید، مدیریت برنامه‌های تولید و بهره‌وری و در نهایت، امکان پیشبرد کار مشترک را نیز، فراهم می‌سازد.




  • تمهیدات اولیه در راستای راهکارهای مبتنی بر 6G
    انویدیا همچنین اعلام کرد که پلتفرم ابری 6G خود را با استفاده ازNvidia Aerial Omniverse Digital Twin (فناوری توسعه‌داده شده توسط انویدیاست که به شرکت‌ها و سازمان‌ها کمک می‌کند تا یک امکان قدرتمند برای شبیه‌سازی و مدل‌سازی دقیق ترکیبی از شبکه‌های بی سیم و سایر زیرساخت‌های تلفن همراه را ایجاد کنند) و با اهداف پژوهشی راه‌اندازی کرده است. شرکت‌هایی از جمله Ansys، Keysight، Nokia و Samsung در بین اولین شرکت‌هایی هستند که از این قابلیت آینده‌نگر استفاده می‌کنند.
    هدف از راه‌اندازی این پلتفرم، استفاده از هوش مصنوعی در شبکه دسترسی بی سیم (RAN) برای برنامه‌ریزی و ساخت راهکارهای مبتنی بر شبکه 6G است. شرکت‌هایی مانند Arm، Softbank و Rohde & Schwarz نیز در این امر با انویدیا همکاری می‌کنند.


جمع‌بندی

در نهایت باید بگم، با وجود همه پیشرفت‌های مشاهه شده تا به امروز، اما حوزه هوش مصنوعی هنوز در مراحل ابتدایی پیاده‌سازی خود قرار دارد و بسیاری از شرکت‌ها هنوز در حال یافتن بهترین روش‌ استفاده از آن برای برنامه‌ها و نیازهای خود و کاربرانشان هستند.
همچنین، ما به زودی شاهد فروش عمده کامپیوترهای شخصی مجهز به فناوری‌های مختلف AI خواهیم بود که نیاز به استفاده از پلتفرم‌های ابری را تا حدی کاهش می‌دهد.
البته که استفاده‌های جدیدی از پلتفرم‌های ابری نیز صورت خواهد گرفت، زیرا برخی از برنامه‌ها نیاز به محاسبات سریع‌تر و پیچیده‌تری دارند که همچنان نمی‌توان محاسبه آن را به کامپیوترهای شخصی سپرد.بسیاری از متخصصان و تحلیلگران این حوزه مقتعدند، که ما تا اطلاع ثانوی، همچنان شاهد یک چرخه بازخورد و خطا از سمت هوش مصنوعی خواهیم بود که تا زمانی که چیزی شبیه به هوش مصنوعی عمومی (AGI) از آن حاصل شود، تقاضا برای محاسبات را به طور مداوم افزایش می‌دهد.
فعلا تا اطلاع بعدی، ما به هوش مصنوعی نیاز داریم، و انویدیا نقش بسیار پررنگی را در استفاده از این امکان، ایفا می‌کند...

انویدیاهوش مصنوعیارزهای دیجیتالماشین لرنینگ
در آینده انحراف معیار دیده شد!
شاید از این پست‌ها خوشتان بیاید