سپهر خسروانی
سپهر خسروانی
خواندن ۲۰ دقیقه·۳ سال پیش

معماری پردازنده های AMD

پیش درامد

واحد پردازش مرکزی یا به اختصار سی‌پی‌یو (CPU) غالباً به نام مغز رایانه نامیده می‌شود. با این که سی‌پی‌یو تنها یکی از انواع واحدهای مختلف پردازشی در رایانه است، اما در واقع مهم‌ترین آن‌ها شناخته می‌شود. این واحد بخشی از رایانه است که برای اجرای محاسبات، اقدامات و اجرای برنامه‌ها مورد استفاده قرار می‌گیرد.

در طی سال‌های متمادی از زمانی که نخستین سی‌پی‌یو عرضه شد، بهبودهای زیادی در آن‌ها ایجاد شده است. اما علی‌رغم این واقعیت، هنوز هم کارکرد اصلی سی‌پی‌یو شامل سه مرحله ساده است: واکشی (Fetch)، کدگشایی (Decode) و اجرا (Execute).

واکشی

همان‌طور که از نام آن بر می‌آید در این مرحله سی‌پی‌یو یک دستورالعمل را دریافت می‌کند. این دستورالعمل به صورت یک سری از اعداد است و از RAM به سی‌پی‌یو ارسال می‌شود. هر دستورالعمل تنها بخشی کوچکی از یک عملیات است. بنابراین سی‌پی‌یو باید بداند که دستورالعمل بعدی چیست. آدرس دستورالعمل کنونی به وسیله شمارنده برنامه یا پی‌سی (PC) نگهداری می‌شود. سپس این پی‌سی به همراه دستورالعمل‌ها در ثبات (Register) دستورالعمل یا IR درج می‌شود. در نهایت طول پی‌سی برای ارجاع به آدرس دستورالعمل بعدی بسط می‌یابد.

کدگشایی

زمانی که دستورالعملی واکشی شده و در ثبات دستورالعمل ذخیره شد، سی‌پی‌یو دستورالعمل‌ها را به یک مدار که مدار کدگشایی دستورالعمل نامیده می‌شود، ارسال می‌کند. در این مرحله دستورالعمل به سیگنال‌هایی تبدیل می‌شود که برای اقدام‌های مختلف به اجزای متفاوت سی‌پی‌یو ارسال می‌شود.

اجرا

در مرحله نهایی دستورالعمل‌های کدگشایی شده به اجزای مرتبط سی‌پی‌یو ارسال می‌شوند تا اجرا شوند. نتیجه کار معمولاً در ثبات سی‌پی‌یو نوشته می‌شود تا بتوان در دستورالعمل‌های بعدی به آن ارجاع داد. این قسمت مانند حافظه ماشین‌حساب عمل می‌کند.

کش های L2/L3

کش های L2 و L3 انواع حافظه‌های آنبورد سریعی در سی‌پی‌یو هستند که در طی محاسبات درونی پردازنده مورد استفاده قرار می‌گیرند. هر چه این کش بیشتر باشد، سی‌پی‌یو عملکرد سریع‌تری خواهد داشت.

ـAMD

زمانی که AMD فعالیت خود را به عنوان سازنده تراشه برای اینتل شروع کرد، کسی فکر نمی‌کرد که روزی به یکی از بزرگترین تولیدکنندگان مستقل پردازنده در سطح جهان تبدیل شود. این شرکت در سال 2003 توانست با تولید پردازنده‌های x86_64 وارد عرصه رقابت مستقیم با اینتل شود و تنها در طی چند سال، به عنوان گزینه‌ای دائمی در لیست خریداران قرار بگیرد.

ـAMD گام اساسی در جهت تکامل پردازشگرهای شخصی با معرفی پردازنده AMD Athlon برداشته است. پردازنده AMD Athlon 64 اولین پردازنده ای است که سازگاری پردازش 64 bit را دارد. AMD Athlon با فن آوری AMD 64 کار می کند، که این فن آوری انقلابی در صنعت کامپیوتر می باشد و قادر است که برنامه های 32 bit را با حداکثر سرعت اجرا کند، در حالی که قابلیت کارکرد بسیار بالا با برنامه های 64 bit را نیز دارد. فن آوری D now3 و سازگاری با SSE2 که بر روی پردازنده AMD Athlon64 وجود دارد، راه کارهای زیادی را برای اجرای برنامه های چندین رسانه ای فراهم میکند و کارایی فوق العاده ای برای نرم افزارهای Audio، Video و برنامه های عکاسی به وجود می آورد. همچنین فن آوري HTT یا همان Hyper Transport Technology استفاده شده است که باعث كاهش تاخير در حافظه و بهبود عملكرد مخصوصا در برنامه هايي كه نياز به حافظه زياد دارند، نظير بازي هاي 3 بعدي و برنامه هاي رسانه اي digital مي شود. این پردازنده حدود 100 جایزه بین المللی به دست آورده است.

معماری K8

ذهنیت استفاده از دو پردازنده جداگانه دسکتاپ بر روی یک برد از مدتها قبل وجود داشته ، اما مشکلاتی از تحقق این فکر ممانعت می‌کرده از جمله اینکه رابطه دو پردازنده با حافظه اصلی تمام پهنای باند ارتباطی را اشغال خواهد کرد و عملا پردازنده با دیگر قطعات پر سرعت مانند گرافیک نمی تواند ارتباط قابل قبولی را دلشته باشد. اما این معماری نیز با به کارگیری چند تکنیک بر این مشکلات فایق آید. از این زمان به بعد تمام پردازنده های FX AMD بر مبنای معماری 4*4 طراحی می شوند (حتی در معماری K10 ). لازم به ذکر است که K8L اولین معماری است پردازدنده های آن مجهز به حافظه کاشه سطح 3 هستند. با اینکه زمان زیادی از ارائه این تکنولوژی ها گذشته در ذیل اشاره ای کوتاه به این تکنولوژی ها می کنیم:

ـIntegrated Memory Controller

هدف این تکنیک از بین بردن واسطه در ارتباط پردازنده با حافظه اصلی بوده و در نتیجه کاهش زمان دسترسی به حافظه (از 80 نانوثانیه به 45 نانو ثانیه) با بر قراری ارتباط مستقیم را به ارمغان آورده است برای این کار کنترلر حافظه مجتمع در پردازنده با دو خط ارتباطی 72 بیتی با حافظه ارتباط دارند که در پردازنده های سرور با حافظه DDR2 667 MHz رنج انتقال داده ای برابر 10.7 GB/s و در مدلهای دسکتاپ با 4 هسته در معماری 4*4 (که از حافظه های DDR2 1066 MHz در معماری K10 پشتیبانی می کنند) به رنج انتقال داده 25.6 GB/s دست یافته اند.

اما یک تکنیک مشکلاتی را هم برای AMD به وجود آورده است از جمله این که تغییر تکنولوژی برای پشتیبانی از حافظه های جدید بسیار پر هزینه خواهد بود به همین دلیل معمولا AMD از نظر زمانی دیر تر از اینتل از حافظه های جدید پشتیبانی می کند.

ـHyperTarsport

ایده اصلی از آنجا نشات گرفت که کنترلر حافظه مجتمع در پردازنده عملا تمام پهنای باند پردازنده را اشغال کرده بود به همین منظور از یک مسیر اختصاصی برای ارتباط دیگر قطعات سخت افزاری پرسرعت مانند VGA که احتیاج به پهنای باند گسترده دارند طرح شده. HT در نسخه اولیه فرکانسی برابر 2.0 GHz و رنج انتقال دادهای برابر 6.4 GB/s را داراست.

ـ(Virtualization (AMD-V

این تکنولوژی باعث افزایش قابلیت سیستم در هنگام ایجاد یک ماشین مجازی روی سیستم (مخصوصا برای پردازنده های سرور) با استفاده از کاهش لایه های میان برنامه های کاربردی و سیستم عامل است این فناوری که pacefica نام دارد یک رابط سخت افزاری با نام Hypervisor است که جایگزین Software Virtualization گشته است.

معماری K9

زمانی که در سال 2003 ، AMDپردازنده های مبتنی بر معماری K8 را ارائه کردند این شرکت از تولید نسل بعدی پردازنده های سرور (Opteron) خود را با استفاده از معماری K9 در سال 2005 خبر داد. در ابتدا قرار بر این بود این معماری فقط به سرور ها اختصاص یابد و بعد در اواسط 2007 هر سه گروه پردازنده ها (سرور ، دسکتاپ و موبایل) به سمت معماری K10 حرکت کنند اما اینگونه نشد و AMD ترجیح داد که تا سال 2007 همچنان پردازنده های سرور خود را با استفاده از معماری K8 (البته توسعه یافته آن) تولید کند و از ماه نوامبر سال جاری پردازنده های K10 با اسم رمز Barcelona را وارد بازار خواهد کرد. لازم به ذکر است پیش از آنکه AMD به طور کامل به سوی معماری K10 حرکت کند در نیمه اول سال 2007 برای توسعه پردازنده های دسکتاپ سری موفق Athlon و Sempron خود اقدام به تولید پردازنده هایی با هسته های جدید (البته برمبنای K8) کرده.

معماری K10

اما معماری کامل‌تری که AMD برای توسعه پردازنده‌های چند هسته‌ای خود انتخاب کرده، K10 نام دارد.‌ K10 نخستین معماری بر پایه 45 نانومتری AMD است. این معماری برای هر سه دسته پردازنده‌های موبایل ، دسکتاپ و سرور در نظر گرفته شده که حدودا از نوامبر سال 2007 در پردازنده‌های ‌این شرکت مبتنی بر ‌این معماری تولید خواهند شد. K10 در ابتدا از فناوری ساخت 65 نانومتری تولید خواهند شد اما به تدریج در فاز دوم به سمت فناوری 45 نانومتری و همچنین پشتیبانی از حافظه های DDR3 با استفاده از سوکت جدید خود AMD3 حرکت خواهد کرد (همچنین بهره گیری از تکنولوژی SOI در ساخت پردازنده 45 های نانومتری).

از برتری‌های معماری K10 (که البته در تمام پردازنده‌هایی‌ که از این معماری استفاده می‌کنند وجود خواهد داشت) می‌توان به استفاده از حافظه نهان سطح 1 سه طرفه (64KB) با پهنای باند128 bit ، افزایش دستورالعمل‌های SSE4A,MMX و رمزگشایی تمامی ‌این دستورالعمل‌ها به شیوه مسیر مستقیم و اضافه کردن 8 ثبات (GPR (General Purpose Register ثبات داده واحد پردازش در مُد 64 بیتی. K10 از Instruction Fetch 32 بایتی پشتیبانی می‌کند . Instruction Fetch ، واحد واکشی برای خواندن دستوالعمل‌ها از حافظه اصلی و انتقال آن به ثبات های پردازنده که در داخل آن تعبیه شده است می‌باشد.البته قرارگیری دستورالعمل هر کد و محل دستور بعدی(در صورت شرطی بودن دستور) در حافظه نهان پیش بینی شده است. همچنین ماکزیمم پهنای باند ارتباطی CPU و حافظه اصلی از 6.4 GB/s (در K8) به 25.4 GB/s (البته در قدرتمندترین پردازنده یعنی Quad FX) رسیده است.در مورد تکنولوژی (HT (HyperTransport به کار رفته در ‌این معماری باید گفت که ‌این نسخه مجهز به HT3.0 است که قابلیت پشتیبانی کامل از نسخه بعدی اسلات کارت‌های گرافیک یعنیPCIExpress 2.0 (که مورد استفاده کارت‌های گرافیک MultiCore خواهد بود) را دارد. در مورد سرعت HT3.0 باید گفت که در پرسرعت‌ترین نوع ، سرعت آن 5.2 GT/s خواهد بود و با وجود خطوط داده 16 بیتی خود به رقم باور نکردنی انتقال داده 41.6 GB/s دست یافته است، که ‌این رقم دو برابر مقداری است که در نسخه قبلی (HT2.0) دیده بودیم.

حال بعد از معرفی معماری جدید ، به ویژگی‌های پردازنده‌های ‌این خانواده می‌پردازیم. ابتدا از پردازنده‌های دسکتاپ و البته از قدرتمندترین آن یعنی AMD Quad FX شروع می‌کنیم:

ویژگی‌های پردازنده‌های‌ خانواده K10

پردازنده‌های سری FX

پردازنده‌های سری FX در ابتدا با اسم رمز Agena FX با فناوری ساخت 65 نانومتر و بعد با اسم رمز Deneb FX که 45 نانومتری است عرضه می‌گردد.‌این پردازنده‌ها تک چیپ و با چهار هسته خواهند بود که هر هسته ، از یک حافظه نهان سطح یک 64 کیلوبایتی دیتا و دستورالعمل و یک حافظه نهان سطح دو 512 کیلوبایتی به طور جداگانه برخوردار است و از 2MB حافظه نهان سطح سه به طور اشتراکی بین هر چهار هسته نیز بهره می‌برد.در معماری قبلی، AMD تکنولوژی Cool’n’Quiet را ارئه کرده بود که بر طبق آن فرکانس کاری پردازنده متناسب با فعالیت سیستم تغییر می‌کرد. در معماری K10 می‌توان گفت که نوعی Cool’n’Quiet به کار رفته به طوری که کار کلی پردازنده بین هسته تقسیم می‌شود ، ‌این امر باعث می‌شود که توان مصرفی پردازنده تا حد قابل ملاحظه‌ای کاهش یابد.

پردازنده‌های سری Phenom

اما دسته دیگر پردازنده‌های دسکتاپ معماری K10 ، پردازنده‌های Phenom X4 و Phenom X2 نام دارند که به ترتیب با اسم رمزهای Agena و Kuma عرضه خواهند شد.البته یک مدل دیگر هم در ‌این دسته وجود دارد با نام Rana ( البته بدون L3 Cache ) که توان مصرفی بسیار پایینی خواهد داشت(در حدود 45w).Phenom X2 که شامل Kuma و Rana در اوایل 2009 جای خود را به Propus وRegor که از فناوری 45 نانومتری بهره می‌برند خواهند داد. البتـهKuma نیز مانند Rana L3 Cache , نخواهد داشت اما سوکت آن AM3 خواهد بود.در مورد سوکت AM3 (که با پردازنده‌های 45 نانومتری ارائه می‌گردند) باید گفت مهندسان شرکتAMD می‌گویند که سوکتی در آن زمان ارائه خواهد شد تغییرات زیادی نسبت به آنچه که هم‌اکنون از AM3 صحبت می‌شود خواهد داشت.همانگونه که می‌دانید AM3 در ابتدا کاندیدایی برای سوکت بعدی AM2 بود که ‌اینگونه نشد و +AM2جای آن را گرفت اما چیزی که واضح می‌باشد ‌اینست که تمام تلاش AMD ، بر تولید سوکت‌های Backward Compatible است یعنی نسخه‌های جدید قابلیت پشتیبانی از سری‌های پیش از خود را نیز داشته باشند، اما پشتیبانی از تکنولوژی‌های روز (مثل پشتیبانی از حافظه‌های DDR3) در اولویت قرار دارد.البته همانگونه که قبلا هم اشاره شد در مرحله بعد تمام Agena ها جای خود را به Deneb خواهند داد و سوکت‌ها هم در مدل‌های X4 و X2 ، همگی AM3 خواهند شد.در‌این میان جای یک پردازنده تک هسته‌ای برای در اختیار گرفتن بازار پردازنده‌های ارزان قیمت (چیزی شبیه به Sempron) خالی به نظر می‌رسد به همین سبب AMD پردازنده Spica را برای‌این بازار در نظر گرفته که از تمامی ‌امکانات پردازنده‌های هم خانواده خود (SSE4A , AMD-V , AM2+ , HT 3.0) بهره‌مند خواهد بود. برای مدل‌های مختلف، فقط به وسیله تفاوت فرکانس کاری از هم تمیز داده شده‌اند علت آن است که AMD در K10 از روال همیشگی برای نامگذاری استفاده نخواهد کرد.از اخبار منتشر شده ‌اینگونه بر می‌آید که پسوند 64 از نام پردازنده حذف خواهد شد. علاوه بر آن نام پردازنده به شما اطلاعات بیشتری همچون توان مصرفی ، رده پردازنده ، و فرکانس اسمی ‌و کاری خواهد داد. برای مثال در پردازنده ای با نام BE-2350 حرف B نشانده این است که این پردازنده در رده میانی (Intermediate) یا متوسط قرار دارد ، حرف E نشانه آن است که توان مصرفی این پردازنده کمتر از 65W خواهد بود و رقم اول عدد چهار رقمی نشانه دو هسته ای بودن این پردازنده است.

پردازنده‌های Mobile

ما بازار دیگری که برای AMD هم بسیار پر اهمیت است بازار پردازنده های موبایل می باشد. در حقیقت پردازنده موبایل AMD از سال 2008 هم در زمینه هسته پردازنده و هم در پلتفرم دست خوش تغییراتی خواهند شد که نتیجه آن مشاهده امکاناتی است که پیش از آن فقط در کامپیوترهای رومیزی شاهد آنها بودیم.اولین پردازنده ای که در سال 2008 عرضه می شود Griffin نام دارد که می توان آن را از سری پردازنده های موفق Turion 64 X2 به حساب آورد.Griffin با پلتفرم جدید خود یعنی Puma ارائه خواهد شد.Griffin یک پردازنده دو هسته ای با توان مصرفی (split-power) و ولتاژ ورودی بسیار پایین است که نتیجه داشتن لپ تاپهایی با طول عمر باطری بیشر خواهد بود.در مورد امکانات Griffin باید گفت که از حافظه های DDR2-800MHz (دو کاناله) وهمچنین از HT 3.0 پشتیبانی خواهد کرد. برای Griffin هنوز سوکتی در نظر گرفته نشده است اما مطمئنا باید انتظار سوکتی جدید و البته متفاوت با سوکت S1 (که درHawk به کار رفت) را داشته باشیم.

پردازنده‌های مخصوص Server

دسته آخر پردازنده های معاری K10 که به آن می پردازیم پردازنده Barcelona است. بارسلونا (که از پردازنده های Cities Family به شمار می رود) یک پردازنده چهار هسته ای 65نانومتری است که از HT 2.0 پشتیبانی می کند. دیگر مشخصات این پردازنده مانند حافظه کاشه، دستورالعملهای SSE و.... کاملا مشابه Phenom ها هستند و فقط امکانات امنیتی پیشرفته ای به آن لضافه شده که آن هم به خاطر ماهیت سرور بودن بارسلونا طبیعی است.

درباره دیگر خصوصیات بارسلونا باید گفت که یک پردازنده پندway به شمار می رود. منظور way در server تعداد پردازنده های قابل استفاده در معماری server است.پردازنده های بارسلونا به دو دسته Opteron 8000/2000 و Opteron 1000 تقسیم می شوند.سریOpteron 8000/2000از سوکتF و حافظه های DDR2 667MHz پشتبانی می کنند و سرعت HT آنها 2.0GT/s است.سری Opteron 1000 از سوکت +AM2 و حافظه هایDDR2 800MHz پشتیبانی می کنند و سـرعت HT بـــرابـر5.2 GT/s دارند.

ـAMD طبقه بندی دیگری بر اساس توان مصرفی در هر سری انجام داده:

  • ـSE پردازنده هایی با توان مصرفی 120W
  • ـStandard پردازنده هایی با توان مصرفی 95w
  • ـHE پردازنده هایی با توان مصرفی 68w

چیپ‌ست RD790

ـAMD از زمان خریداری کمپتانی ATI چیپ‌ستهای مادربردی که از پردازنده‌های AMD‌پشتیبانی می‌کنند را خود متناسب با تولیدات پردازنده‌هایش تولید و عرضه می‌کنند RD790 نیز یک چیپ‌ست جدید است که برای پردازنده‌های معماری K10 طراحی شده‌ است. RD790 درحقیقت توسعه یافته چیپ‌ست ATI 580X با تغییرات عمده می‌باشد. که توانایی‌های قابل توجهی را به آن افزوده شده است.یکی از این تغییرات که بزرگترین امتیاز RD790 نیز به حساب می‌آید استفاده از 41 مسیر PCI-e2.0 است که پشتیبانی از 4 اسلات PCI-e2.0x16 را برای RD790 به ارمغان و توانسته یک برتری نسبی از رقیب خود پیدا کند.برخلاف nvidia SLI که فقط توانایی بهره‌مندی از 2 یا 4 پردازنده گرافیک را در حالت SLI دارد. چیپ‌ست RD790 در حالت Cross fire توانایی پشتیبانی از 1,2,4 ویا حتی 3 پردازنده گرافیک را دارا می‌باشد. در حالت استفاده از 3 پردازنده 2.6x افزایش سرعت و کارایی و در هنگام استفاده از 2 کارت ، 1.8x بهبود را شاهد هستیم. اما هنوز AMD نتایج استفاده از 4 پردازنده را فاش نکرده است.RD790 یک چیپ‌ست 27*27mm با فناوری ساخت 65nm می‌باشد که توانایی پشتیبانی از HT3.0 و سوکتهای +AM2 را دارد.همچنین حداکثر توان مصرفی تحت بیشترین فشار کاری(TDP) در این چیپ‌ست 10Wat می‌باشد.زمان ارائه RD790 چندان دور نیست و قرار است قبل از عرضه پردازنده‌های Phenom(نیمه دوم 2007)مادربردهای مجهز به این چیپ‌ست وارد بازار شوند.

ـAMD Fusion

ـFusion در لغت به معنی هم جوشی است و البته نام معماری بعدی AMD ، در حقیقت بعد از معماری K10 ،کمپانی AMD قصد دارد تا در تمام زمینه‌های فعالیتی خود، مخصوصا پردازنده‌های موبایل به سمت معماری Fusion حرکت کند. بزرگ‌ترین هدف ‌این معماری را می‌توان مجتمع کردن GPU یا همان پردازنده گرافیکی در پردازنده اصلی دانست.هم اکنون به منظور به وجود آوردن قابلیت پردازش گرافیکی فوق العاده در کامپیوتر وظایف هر قطعه بسیار تخصصی‌ است به طوری که پردازنده اصلی (CPU) وظیفه‌ای برای پردازش گرافیکی برعهده ندارد و یک پردازنده جداگانه که به طور مستقل حافظه اصلی هم دارد به نام GPU اینگونه عملیاتها را انجام می‌دهد اما مشکلی که در این بین وجود دارد و مانعی برای توسعه آنها به شمار می‌رود وفقه زمانی بین پردازش این دو پردازنده به خاطر وجود پهنای باند محدود بین این دو قطعه است. جدیدترین راه حلی که برای حل این مشکل ارائه شده مجتمع کردن این دو پردازنده است.Fusion را می‌توان تا حدودی با کاری که‌اینتل با FPU انجام داد مقایسه کرد(اینتل FPU را در پردازنده های سری 486 خود به داخل CPU انتقال داد که از آن زمان تا کنون همچنان‌ این جریان ادامه دارد).اما باید گفت چند تفاوت عمده میان FPU وGPU وجود دارد که بزرگی و دشواری کار را هرچه بیشتر نمایان می‌سازد. از جمله ابعاد GPU است که اصلا با FPU قابل مقایسه نیست و دیگری نا هماهنگی در فرکانس کاری ‌این دو پردازنده است.البته ‌این نکته را هم باید در نظر گرفت که در صورت مجتمع شدن GPU احتیاج به یک پهنای باند گسترده برای ارتباط با حافظه اصلی و سرعت بخشیدن به ‌این حافظه است.در صورت تحقق‌ این طرح ، بهترین نامی‌که می‌توان بر روی ‌این پردازنده‌ها گذاشت Heterogeneous Multicore processor خواهد بود.

معماری های بعدی AMD

ـAMD در سال 2011 دو تراشه جدید به نام های Bobcat و Bulldozer روانه بازار کرد. این 2 پردازنده اولین پردازنده های این شرکت هستند که هسته گرافیکی و هسته پردازشی در آن ها به صورت یک بسته واحد کنار یکدیگر قرار دارد.AMD به جای قرار دادن 2 قطعه سیلیکون در یک بسته یک قطعه سیلیکونی را بین آن ها به اشتراک گذاشته است.

ـBulldozer

هسته بولدوزر 2 واحد اجرایی را با اجزائی چون حافظه پنهان که قابلیت اشتراک گذاری دارد، در کنار هم جاسازی کرده است. کارکرد این واحدهای اجرایی از بسیاری جهات شبیه فناوری ابرچندرشته ای اینتل بوده و به هسته پردازنده اجازه می دهد دو کار را در یک زمان انجام دهد.

ـBobcat

ـAMD نام باب کت را به خاطر چابکی و سرعت انتقالش بر این هسته نهاده است. اولین پردازنده ای که طراحی باب کت در آن به کار رفت، اوایل سال 2011 با نام مستعار اونتاریو (ontario) به بازار عرضه شد. باب کت اجرای دستورات خارج از قاعده را نیز مورد پشتیبانی قرار می دهد.

ـAMD ادعا می کند این پردازنده تا حدود 90 درصد کارآیی استاندارد پردازنده های امروزی را در نصف مساحت سیلیکون به کار رفته در آنها ارائه می دهد که این کارایی بالا و میزان پایین برق مصرفی، بر ارزش آن به میزان زیادی افزوده است.

ـLIano

اولین واحد شتابدهی (APU) که AMD عرضه کرد، Liano نام دارد که شامل یک پردازنده چهار هسته‌ای از خانواده فنوم2 در کنار یک گرافیک از خانواده DirectX 11 روی یک تراشه هستند. پردازنده‌های Liano از کنترل حافظهDDR3 برخوردار بوده و با فناوری 32 نانومتری تولید خواهند شد.

ـOntario

این پردازنده‌ها برخلافLiano ازمهندسی جدید با‌ب‌کت بهره برده و با فناوری 40 نانومتری تولید شد. این واحد شتاب دهی از دو هسته باب‌کت استفاده خواهند کرد و با هسته گرافیکی DX 11 نیز همراه خواهند شد.

ـZambezi

اولین پردازنده‌های دسکتاپ مبتنی بر مهندسی Bulldozer، با این نام خوانده می‌شوند. پردازنده‌های Zambezi حداکثر 4 ماژول بولدوزر در خود داشته که تحت عنوان 8هسته‌ای به فروش رسیدند. این پردازنده‌ها در دسته واحدهای شتابدهی(APU) قرارنمی‌گیرند و بنابراین گرافیک مجتمع نیز نخواهند داشت.

با این حساب، سازگاری آنها با سوکت AM3 ساده‌تر بوده و AMD نیز چنین وعده‌ای داده است. این پردازنده‌ها به کنترلر حافظه DDR3 مجهز بوده و جزئی از پلتفرم Scorpiusدر سال 2011 هستند.

معماری های جدیدتر AMD

ـRyzen نام تجاری ریزپردازنده‌های جدید شرکت ای‌ام‌دی می‌باشد که در سال 2017، نخستین مجموعه از این پردازنده‌ها بر پایه ریزمعماری ذن تولید گردیده‌اند. محصولات نخستین از برند رایزن بر پایه فناوری 14 نانومتری به صورت رسمی در اجلاس افق جدید شرکت ای‌ام‌دی در ۱۳ دسامبر 2016 معرفی گردید. نسل دوم پردازنده‌های رایزن مجهز به ریزمعماری ذن+ هستند و بر پایه فناوری 12 نانومتری ساخته شده که در آوریل 2018 معرفی گردیدند. نسل سوم نیز مبتنی بر معماری ذن ۲ است که دارای پیشرفت چشمگیری در طراحی است و بر پایه فناوری 7 نانومتری در 7 ژوئیه 2019 ارائه گردید.

اغلب محصولات برند رایزن از پلتفرم سوکت AM4 بهره می‌برند اما با این همه، در اوت سال 2017، ای‌ام‌دی، یک مجموعه پردازنده‌های رومیزی با تعداد هسته بالا را تحت عنوان رایزن تردریپر روانه بازار مصرف کرد. تردریپر از سوکت بزرگ‌تر TR4 استفاده می‌کند که توانایی استفاده از کانال‌های حافظه بیشتر و همین‌طور امکان استفاده از خطوط پی‌سی‌آی اکس‌پرس بیشتر را نیز فراهم می‌نماید.

ویژگی‌های پردازنده‌های Ryzen

ـRyzen 5 3500X, 3500

این سری ازCPU ها 6 هسته حقیقی و 6 هسته مجازی دارند و سرعت آنها حداکثر به 4.1 گیگاهرتز میرسد.

ـRyzen 5 3600X, 3600

این سری ازCPU ها 6 هسته حقیقی و 12 هسته مجازی دارند و سرعت آنها حداکثر به 4.4 گیگاهرتز میرسد.

ـRyzen 7 3700X, 3800X

این سری ازCPU ها 8 هسته حقیقی و 16 هسته مجازی دارند و سرعت آنها حداکثر به 4.5 گیگاهرتز میرسد.

ـRyzen 9 3900X

این سری ازCPU ها 12 هسته حقیقی و 24 هسته مجازی دارند و سرعت آنها حداکثر به 4.6 گیگاهرتز میرسد.

ـRyzen 9 3950X

این سری ازCPU ها 16 هسته حقیقی و 32 هسته مجازی دارند و سرعت آنها حداکثر به 4.7 گیگاهرتز میرسد.

پردازندهAMD Ryzen 9 3950X را می توان اولین تراشه MSDT جهان دانست که تا 16 هسته فیزیکی و 32 رشته منطقی را در اختیار سیستم و کاربران خانگی قرار می دهد؛ پس کاربرد آن چیزی فراتر از بازی است. این پردازنده از 2 چیپ 8 هسته‌ای بر روی یکPCB به همراه یک کنترلر I/O مجزا تشکیل شده است. این محصول با فرکانس پایه 3.5 گیگاهرتزی معرفی گشته وAMD برای افزایش کارایی حافظه های کش را در سری ریزن 3000 تا 2 برابر افزایش داده است. پشتیبانی از PCIe Gen4 برای اولین بار در پردازنده ها.

مقایسه ی لیتوگرافی پردازنده های Intel و AMD

چند فناوری اساسی وجود دارد که قدرت هر تراشه را تعیین می کند. اساسی ترین قاعده این است که هرچه nodeهای پردازشی متراکن تر و سایز ترانزیستور ها کوچک تر شوند، تراشه قوی تری خواهیم داشت. با توجه به این معیار پردازنده های AMD در مقابل پردازنده های اینتل را اگر بررسی کنیم ، AMD هم در لیتوگرافی و هم در معماری پیشتاز است.

برخلاف intel ، AMD پردازنده های خود را تولید نمی کند. در عوض ، این شرکت پردازنده های خود را طراحی می کند و سپس با کارخانه های خارجی که در واقع تراشه ها را تولید می کنند ، قرارداد می بندد. در مورد پردازنده های Ryzen نسل فعلی AMD ، این شرکت برای تراشه های خود از ترکیبی از فرآیند 12 نانومتری GlobalFoundries و گره 7 نانومتری TSMC استفاده می کند که فرآیند دومی مهم تر است. از مزایای گره 7 نانومتری TSMC این بدان معنی است که AMD می تواند تراشه های ارزان تر ، سریع تر و متراکم تری با هسته های بیشتر و با توان مصرفی کم تر ایجاد کند.

گره 7 نانومتری TSMC توسط بسیاری از شرکت های دیگر مانند اپل و کوالکام مورد استفاده قرار می گیرد. نتیجه آن چیزی است که خود اینتل گره های 7 نانومتری AMD را در مقایسه با تراشه های 10 نانومتری و 14 نانومتری خود برتر می داند. اینتل مدت زیادی است که روی عدد 14 نانومتر گیر کرده و در پردازنده های نسل 10 , 11 لپ تاپ از لیتوگرافی 10 نانومتری استفاده کرده است . با توجه به این intel روی فرآیند لیتوگرافی 10 نانومتری سرمایه گذاری بسیار زیادی کرده است این احتمال وجود دارد که تا سال 2023 در همین لیتوگرافی بماند و سپس به سراغ لیتوگرافی 7 نانومتری برود، البته اینتل ادعا کرده است که توانسته به لیتوگرافی 7 نانومتری دست پیدا کند اما فرآیند تجاری سازی آن احتمالا از سال 2023 آغاز می شود.

مقایسه ی معماری پردازنده های Intel و AMD

هنگام مقایسه پردازنده های AMD و Intel ، باید در نظر بگیریم که دو تصمیم طراحی یعنی ارتباطات متقابل و ریز معماری. تأثیر زیادی بر عملکرد ، مقیاس پذیری پردازنده دارند. Fabric Infinity AMD به این شرکت اجازه می دهد تا چندین قالب را به یک پردازنده منسجم متصل کند. به این فکر کنید که قطعات متعددی از یک پازل است که با هم جمع می شوند و یک تصویر بزرگتر را تشکیل می دهند. این روش به AMD امکان می دهد از بسیاری از قالب های کوچک به جای یک قالب بزرگ استفاده کند و این روش باعث بهبود عملکرد و کاهش هزینه می شود. همچنین مقداری از مقیاس پذیری را به دست می دهد که ممکن است اینتل نتواند با اتصال شبکه مش جدید خود در داخل تراشه های HEDT مطابقت داشته باشد و بدون شک در پردازنده های دسکتاپ خود از bus حلقه ای اینتل پیشی می گیرد.

ـAMD برای اولین بار این مزیت را با ریز معماری Zen خود ، که از ابتدا برای مقیاس پذیری طراحی شده ، جفت کرد و 52٪ افزایش دستورالعمل در هر ساعت (IPC) نسبت به تراشه های قبلی بولدوزر AMD داشت. میکرو معماری ذن 2 با بهبود 15٪ دیگر IPC. ذن 3 با افزایش 19 درصدی IPC همراه است.

حرکت به سمت معماری Zen 2 ، پردازنده های AMD را با بهترین عملکرد اینتل از نظر عملکرد هسته تقریباً برابری می کند. این بیشتر به این دلیل است که اینتل روی 14 نانومتر گیر کرده است و معماری آن مخصوص گره هایی که روی آن ساخته شده اند طراحی شده است. این بدان معناست که میکرو معماری های جدید اینتل تنها می توانند از فرایندهای کوچکتر مانند 10 نانومتر استفاده کنند و این شرکت را برای تولید طولانی مدت محصولات 10 نانومتری آماده نمی کند. آن‌ها می‌خواهند در آینده با توسعه ریزمعماری‌هایی که قابل استفاده در نودهای مختلف هستند این مشکل را برطرف کنند، اما تا آن زمان چاره‌ای به جز استفاده از ریزمعماری قدیمی Skylake ندارند.

راهنما
استاد داود یعقوبی تبار
منابع و مراجع
AMD - wikipedia - INTEL - vista - digiato
amdریزپردازندهintelمعماری پردازندهدانشگاه صدرا
شاید از این پست‌ها خوشتان بیاید