"در این مقدمه، ما در مورد مفهوم کلی HPC یا پردازش با کارایی بالا صحبت خواهیم کرد. همچنین، به بررسی مفاهیم ابررایانه و عناصر اصلی آن خواهیم پرداخت. HPCتنها یک فناوری نیست، بلکه یک اکوسیستم جامع است که شامل زیرساختها، اتصالات، و تواناییهای مختلف میشود. در اینجا، بر مفهوم حافظه مشترک و حافظه توزیع شده، و همچنین نحوه برنامهنویسی با استفاده از OpenMP یا MPIتمرکز خواهیم داشت.
در پیشرفتهای آینده، دستگاههای کوانتومی و تراشههای نورومورفیک میتوانند نقش مهمی داشته باشند. در عمل، این تکنولوژیها ماژولار هستند و به طور مداوم در حال ادغام و بهینهسازی شدن هستند. در آینده، میتوان انتظار داشت که عملکرد موازی همچنان تحت تأثیر جنبههای سریالی قرار بگیرد، که ممکن است محدودیتهایی مانند قانون آمدال را نیز به وجود آورد.
در ادامه، ما به اهمیت برنامهها در HPC تأکید میکنیم. برنامههای موثر و کارآمد میتوانند تفاوت بزرگی در عملکرد و کارایی سیستمهای HPCایجاد کنند. همچنین، بررسی میکنیم که چگونه این برنامهها برای دامنههای مختلف کاربردی تنظیم میشوند و چگونه میتوان از ابزارهای اندازهگیری عملکرد برای بهینهسازی کدها استفاده کرد.
در نهایت، ما به مفهوم اکوسیستم HPC پرداختیم که نه تنها شامل سختافزارها، بلکه نرمافزارهای پیچیده و سیستمهای عامل نیز هستند. برای دستیابی به بهترین عملکرد و استفاده از پتانسیل کامل HPC، نیازمند یک اکوسیستم جامع و یکپارچه هستیم."
بنابراین، با داشتن تعداد زیادی فناوری برای ادغام، میتوانید تصور کنید که نظارت بر این موارد، سیستمها نیز به همان اندازه مهم هستند. بنابراین، در اینجا مدیران سیستم، افرادی هستند که مسئول سیستمهایی هستند که اساساً باید بدانند آیا همه چیز به خوبی کار میکند. ما سیستمهایی مانند Genglia و بسیاری دیگر را داریم که به عنوان مثال در Julie llviewبارگذاری میشوند و به شما این امکان را میدهند که واقعاً سیستم را به صورت زنده ببینید. اساساً این کم و بیش شبیه ضربان قلب است، بنابراین برنامههایی که در آن اجرا میشود، باید تمام گرهها را در نظر بگیرد.
پوشاندن در سراسر سخت افزار، به اصطلاح بارگذاری سیستم، بخش مهمی است و ما میخواهیم کاربران را خوشحال کنیم که این کار را نمیکنند. در مورد سیستمهای مانیتورینگ که استفاده میشود، سیستمهای HPC نیز مهم هستند. این مسائل برنامهها را بررسی میکند و بازخورد میدهد و سپس چند سخنرانی بر آنچه قبلاً گفته شده است، تمرکز میکنند. عملکرد را اندازهگیری کردن آنقدر هم آسان نیست. الگوهای خاصی از رفتار ناکارآمد مانند ارسال پیامهای اشتباه و نقشهبرداری بدی به پردازندهها و هستهها وجود دارد. بنابراین، فرض کنید یک فرآیند تجزیه و تحلیل عملکرد با ابزارهایی مانند Skeleton و ابزارهایی مانند خونآشام باید بررسی شود. این تنها فرض نیست که تجزیه و تحلیل عملکرد را پوشش میدهد، بلکه ایده اشکالزدایی پروفایل این برنامهها را نیز پوشش میدهد و با این کار شما باید نرمافزار سیستم HPC را واقعاً بزرگ را مجبور کنید که برنامههای شما را روی سیستمهای HPC به یک فناوری نوظهورتر تبدیل کند. تعاملی تر است.
کلمه ای که جالب است، به این معنی که واقعاً این پردازش دستهای نیست که ما در مورد آن بحث کردیم. برای بارهای برنامههای مختلف، باید ببینید که برنامهها همه متفاوت هستند. مثال بسیار خوبی از جریان هوا از طریق بینی از یکی از همکاران من که روی این کار کار میکند، بحث کردیم. و اساساً سپس از HPCتعاملی استفاده میکند. برای کار در آن محیط خاص، همچنین مشاهده میشود که زمینه هوش مصنوعی بسیار سریع تکامل مییابد، مانند یادگیری عمیق ماشینی. این همه بخشها و سخنرانیهای دوره هستند. وقتی به آنجا میآییم، به طور فشرده در مورد آنها بحث خواهیم کرد. اما پیام کلیدی که باید حذف کنید، این است که برخی برنامهها بیشتر به روش تعاملی انجام میشوند در حالی که بسیاری از افراد شاید هشتاد درصد یا نود درصد از پردازش دستهای استفاده کنند. ما هنوز کاربران جدید داریم و بیشتر و بیشتر کاربران هوش مصنوعی که از محاسبات فوقالعاده تعاملی استفاده میکنند، و رویکردهایی مانند نوتبوک مشتری وجود دارد که احتمالاً قبلاً از آن شنیدهاید که توسط Jupiter Hub نیز فعال شده است و برای چند کاربر نسخههای مختلف دادههای نوتبوک و غیره و مواردی که در دسترس شما هستند، به اشتراک گذاشته میشود. بنابراین، چیزی است که ما در دوره استفاده خواهیم کرد و برخی از شما قبلاً جزو دورههای کلان داده و محاسبات ابری هستید. بنابراین، قبلاً از این فناوری خاص استفاده کردهاید که به شما دسترسی تعاملی به ابررایانه را میدهد تا از GPUs شاید برای یادگیری عمیق پیشرفته استفاده کنید. اساساً یک رویکرد متفاوت تر که ما باید هنگام بررسی زمان بندی و غیره به آن نگاه کنیم زیرا این البته روی زمان بندی تأثیر دارد .