۱۰ دلیل شکست پروژه‌های یادگیری ماشینی در مقیاس بزرگ

منتشر شده در analyticsinsight به تاریخ ۲۵ آگوست ۲۰۲۲
لینک منبع 10 Reasons Why Large-Scale Machine Learning Projects Fail

امروزه ما می‌توانیم در مورد هوش مصنوعی و محتوای یادگیری ماشینی تقریبا در همه جا مطالعه کنیم. بدون شک هوش مصنوعی و یادگیری ماشینی این پتانسیل را دارند که بسیاری از مشکلات را حل کنند. با این حال، همه پروژه‌های یادگیری ماشینی موفق نیستند. براساس برخی گزارش‌ها، ۸۵ درصد از پروژه‌های فراگیری ماشینی با شکست مواجه شده‌اند. راه‌های قابل‌پیش‌بینی زیادی وجود دارد که پروژه‌های یادگیری ماشینی با شکست مواجه می‌شوند، که می‌تواند با تخصص و احتیاط مناسب اجتناب شود. در اینجا لیستی از دلایل اصلی شکست پروژه‌های یادگیری ماشینی در مقیاس بزرگ آورده شده‌است.

استفاده از داده‌هایی که ML-Ready نیستند: اکثر شرکت‌ها درگیر نوعی تحول دیجیتال هستند، به این معنی که داده‌ها را تولید می‌کنند. یادگیری ماشینی می‌تواند کارهای قابل‌توجهی با داده‌ها انجام دهد، اما باید داده‌های آماده ML یا «پاک» باشد. و روش‌های زیادی وجود دارد که داده‌ها می‌توانند در این آزمون شکست بخورند. داده‌ها باید چند وجهی باشند که یادگیری ماشینی بتواند الگوهای معنی‌دار را در آن تشخیص دهد. این یکی از سه مورد استفاده برتر است که مشتریان ما دنبال می‌کنند زیرا انرژی تقریبا ۲۰٪ از هزینه‌های خروجی آن‌ها را نشان می‌دهد.

فقدان تخصص: فشار برای دانشمندان داده در حال کم شدن و کم شدن است. بیشتر یادگیری ماشینی یا پروژه‌های هوش مصنوعی نیاز به دانشمندان با تجربه داده برای مقابله با وظایفی مانند انتخاب مدل، نظارت عملکرد، و ارزیابی دارد.

عدم هم‌کاری: عدم هم‌کاری بین تیم‌های مختلف مانند دانشمندان داده، مهندسان داده، متخصصان BI، و مهندسی، یکی دیگر از چالش‌های عمده است. این امر به ویژه برای تیم‌ها در طرح مهندسی چیزها مهم است. این تیم مهندسی است که قصد دارد مدل یادگیری ماشینی را اجرا کند و آن را به تولید برساند.

فقدان استراتژی داده: به احتمال زیاد تنها ۵۰ درصد از شرکت‌های بزرگ با بیش از ۱۰۰۰۰۰ کارمند، استراتژی داده دارند. توسعه یک استراتژی داده جامد قبل از شروع پروژه یادگیری ماشینی بسیار مهم است.

پروژه‌های غیرقابل اجرا از نظر فنی: از آنجایی که هزینه پروژه‌های یادگیری ماشینی بسیار گران است، اکثر شرکت‌ها تمایل دارند که پروژه‌های بیش‌پرواز جاه‌طلبانه ماه را هدف قرار دهند که شرکت یا محصول را کاملا متحول می‌کند و بازده یا سرمایه‌گذاری بزرگی را به همراه خواهد داشت.

از دست دادن داده‌های با کیفیت خوب: با افزایش تاثیر مجموعه داده‌ها، چالش‌های جدیدی نیز در حال ظهور هستند. موقعیت‌های زیادی وجود دارند که در آن‌ها شما باید داده‌ها را از یک دسته از منابع داده مختلف ادغام کنید. داده‌های با کیفیت بد قابل‌استفاده نیستند و می‌توانند منجر به نتایج گمراه‌کننده شوند.

فقدان سیگنال‌های قوی در داده‌ها: داده‌های مناسب، سیگنال‌هایی دارند که شما برای بهینه‌سازی نتایج کسب‌وکار به آن‌ها نیاز دارید. یادگیری ماشینی نمی‌تواند بدون داده‌های درست کار کند. آزمایش‌ها کوچک را انجام دهید و از عقل سلیم برای یافتن داده‌های ورودی مناسب برای مشکل خود استفاده کنید. این حوزه‌ای است که دانشمندان با تجربه داده می‌توانند ارزش زیادی به آن بیافزایند.

وظایف فنی غیرممکن: از آنجایی که پروژه‌های یادگیری ماشینی بسیار پرهزینه هستند، اکثر شرکت‌ها تمایل دارند روی پروژه Moon-Shot تمرکز کنند. چنین پروژه‌ای ممکن است تیم علم داده را به حد خود برساند و به احتمال زیاد تکمیل نخواهد شد. در نهایت، مدیریت اعتماد به نفس خود را از دست می‌دهد و سرمایه‌گذاری را متوقف می‌کند.

فقدان حمایت رهبران: گاهی اوقات رهبران فاقد صبر و اعتماد فنی لازم برای تحقق یک پروژه یادگیری ماشینی هستند. برای موفقیت یک پروژه یادگیری ماشینی، بسیار مهم است که همه را همراهی کنید.

بهینه‌سازی بدون کاوش: در یادگیری ماشینی، ایجاد توانایی اعتبارسنجی و بهبود مستمر مدل مهم است. مهم است که ارزش استفاده نکردن از بهترین مدل برای کل مخاطبین خود را درک کنید. برای مدل‌هایی که توضیحات را ارائه می‌دهند، شما باید تنوع کافی در داده‌ها را حفظ کنید تا به طور مداوم آن توضیحات را معتبر کنید و بینش‌های جدیدی ایجاد کنید.

این متن با استفاده از ربات ترجمه مقالات علم داده ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.