ویرگول
ورودثبت نام
Mohammad Shokoohi
Mohammad Shokoohiیک هنرمندِ عاشق تکنولوژی...
Mohammad Shokoohi
Mohammad Shokoohi
خواندن ۴ دقیقه·۷ ماه پیش

تجربه‌ی من در استفاده از Ollama روی گرافیک RX5700XT 8GB

حدود یک ماه پیش، نیاز داشتم از سرویس Ollama استفاده کنم؛ اما متأسفانه متوجه شدم که کارت گرافیک AMD RX 5700 XT 8GB موجود در سیستم من از این سرویس پشتیبانی نمی‌کند. به همین دلیل، جست‌وجوی راهکاری برای انتقال بار پردازشی مدل‌های زبانی به GPUرا آغاز کردم. خوشبختانه، به نتیجه مطلوبی دست یافتم که از نظر عملکرد تا حد زیادی قابل قبول بود.

با توجه به شرایط نامناسب اقتصادی و دشواری بسیاری از افراد در تهیه‌ی یک کارت گرافیک قدرتمند، خرید چنین سخت‌افزاری شاید برای برخی کاربران Ollama منطقی نباشد. از این رو، استفاده از کارت گرافیکی که بتواند تا حد زیادی کندی اجرای نسخه‌ی محلی Ollama را کاهش دهد، گامی مؤثر به سمت بهینه‌سازی عملکرد محسوب می‌شود.

در ابتدا، به بررسی کارت‌های گرافیکی AMD که به‌طور رسمی توسط Ollama پشتیبانی می‌شوند، خواهیم پرداخت. سپس، گزینه‌هایی را که می‌توان به‌صورت غیررسمی برای اجرای Ollama فعال کرد، مورد ارزیابی قرار خواهیم داد.

تصویر شماره ۱
تصویر شماره ۱

در تصویر شماره ۱ مشاهده می‌کنید که کدام کارت‌های گرافیک قابلیت اجرای مدل‌های زبانی را به‌صورت محلی دارند. این بدان معناست که کاربران می‌توانند با استفاده از این کارت‌های گرافیکی AMD، مدل‌های زبانی را بدون نگرانی و با سرعتی قابل قبول به‌صورت محلی اجرا کنند.

اکنون به بررسی کارت‌های گرافیکی خواهیم پرداخت که امکان فعال‌سازی غیررسمی آن‌ها در Ollama وجود دارد و می‌توانند عملکرد بهتری نسبت به پردازش مبتنی بر CPU ارائه دهند.

این دسته از کارت‌های گرافیکی، هرچند به‌طور رسمی توسط Ollama پشتیبانی نمی‌شوند، اما با تنظیمات خاص و استفاده از روش‌های جایگزین می‌توان آن‌ها را برای اجرای مدل‌های زبانی بهینه‌سازی کرد. بهره‌گیری از این گزینه‌ها می‌تواند به کاربران کمک کند تا سرعت پردازش را افزایش دهند و تجربه‌ی روان‌تری در اجرای مدل‌های محلی داشته باشند:

تصویر شماره‌ ۲
تصویر شماره‌ ۲

در جدول شماره ۲، می‌توانید مشاهده کنید که آیا GPU یا APU شما به‌صورت غیررسمی قابلیت راه‌اندازی در Ollama را دارد یا خیر.

در این جدول، منظور از dGPU همان کارت گرافیک مستقل است که به‌عنوان یک واحد پردازشی مجزا در سیستم عمل می‌کند. همچنین، APU به پردازنده‌های گرافیکی یکپارچه‌ای اطلاق می‌شود که در CPU تعبیه شده‌اند و معمولاً تحت عنوان «آنبرد» شناخته می‌شوند.

همچنین لازم است به این نکته توجه داشته باشید که به‌دلیل به‌روزرسانی‌های مداوم و عدم تعهد تیم توسعه‌ی Ollama نسبت به پشتیبانی از کارت‌های گرافیکی غیررسمی، احتمال دارد که برخی از این پردازنده‌های گرافیکی در نسخه‌های آینده دیگر قابل راه‌اندازی نباشند. این تغییرات می‌توانند به‌واسطه‌ی اصلاحات در نرم‌افزار، تغییرات در معماری پردازش، یا بهینه‌سازی‌های جدید رخ دهند.

بنابراین، کاربران باید این احتمال را در نظر بگیرند و در صورت استفاده از سخت‌افزارهای غیررسمی، آمادگی مواجهه با محدودیت‌های احتمالی در نسخه‌های آتی را داشته باشند. بررسی تغییرات و اطلاع از به‌روزرسانی‌های جدید می‌تواند به تصمیم‌گیری بهتر شما کمک کند.

در تجربه‌ی شخصی خود، پس از راه‌اندازی کارت گرافیک RX 5700 XT با حافظه‌ی ۸ گیگابایتی، بهبود چشمگیری در سرعت اجرای مدل‌های زبانی به‌صورت محلی مشاهده کردم. این تفاوت به اندازه‌ای محسوس بود که پس از پردازش روی GPU، عملکرد کند CPU دیگر برایم قابل تحمل نبود.

به‌عنوان مثال، مدل Gemma3 با ۱ میلیارد پارامتر و حجم تقریبی ۸۰۰ تا ۹۰۰ مگابایت، هنگام پردازش روی CPU به‌شدت کند و همراه با تأخیر عمل می‌کند. همچنین، اجرای مدل‌های بزرگ‌تر با ۴ میلیارد یا ۸ میلیارد پارامتر تأثیر منفی بیشتری بر تجربه‌ی کاری خواهد داشت. برای من، مدل Gemma3 با ۱۲ میلیارد پارامتر روی CPU به‌طور کامل اجرا نشد.

نکته‌ی مهم دیگری که باید در نظر گرفته شود، تأثیر مستقیم حجم رم سیستم و رم کارت گرافیک بر سرعت اجرای مدل‌ها است. به‌عنوان نمونه، کارت گرافیک ۸ گیگابایتی من توانایی اجرای مدل‌های ۸ میلیارد پارامتر و بالاتر را دارد، اما با مقداری کندی مواجه می‌شود. البته، در مدل Gemma3 با ۱۲ میلیارد پارامتر، این کاهش سرعت تا حدی قابل تحمل است. بنابراین، برای داشتن تجربه‌ی پردازشی روان‌تر، پیشنهاد می‌شود از کارت گرافیکی با ۱۲ گیگابایت رم یا بیشتر استفاده شود.

سخن پایانی

اگر قصد دارید Ollama را روی کارت گرافیکی اجرا کنید که به‌صورت رسمی پشتیبانی نمی‌شود، می‌توانید مقاله‌ای را که پیش‌تر در این زمینه نوشته‌ام، مطالعه کنید. در این مقاله، روش‌هایی برای فعال‌سازی غیررسمی کارت‌های گرافیکی و بهینه‌سازی عملکرد آن‌ها ارائه شده است.

برای دسترسی به این مقاله، می‌توانید از لینک زیر استفاده کنید:

https://virgool.io/@m.shokoohirad/0073-twwemespt92i

با مطالعه‌ی این مقاله، اطلاعات جامعی درباره‌ی نحوه‌ی راه‌اندازی Ollama روی کارت‌های گرافیکی غیررسمی کسب خواهید کرد.

امیدوارم که این مقاله بتواند به شما در پیشبرد اهدافتان در زمینه‌ی هوش مصنوعی کمک کرده باشد، اگر این مطلب برای شما مفید بود، خوشحال می‌شوم من را در کافیته یا دارمت به یک قهوه مهمان کنید و به من برای تولید محتوای بهتر و قوی‌تر انگیزه دهید.

هوش مصنوعیکارت گرافیک AMDمدل‌های زبانی
۱
۰
Mohammad Shokoohi
Mohammad Shokoohi
یک هنرمندِ عاشق تکنولوژی...
شاید از این پست‌ها خوشتان بیاید