برداشتن قیدهای هوش مصنوعی آینده علم داده است

منتشر شده در analyticsinsight به تاریخ ۲۳ نوامبر ۲۰۲۲
لینک منبع Removing the Shackles on AI Is the Future of Data Science

هوش مصنوعی بالاخره با هیاهویی که دهه‌هاست به راه انداخته است، عمل می‌کند. در حالی که هوش مصنوعی (هنوز) ناجی بشریت نیست، از مفهوم به واقعیت پیشرفت کرده است و کاربردهای عملی در حال بهبود محیط ما هستند.

با این حال، مانند کلارک کنت، بسیاری از بهره‌برداری‌های خیره کننده هوش مصنوعی پوشیده هستند و تأثیرات آن را تنها زمانی می‌توان دید که به ورای ماسک معمولی نگاه کنید. BNP Paribas Cardifرا در نظر بگیرید، یک شرکت بیمه بزرگ که در بیش از 30 کشور فعالیت دارد. هر سال، این سازمان حدود 20 میلیون تماس مشتری را انجام می‌دهد. آن‌ها می‌توانند محتوای تماس‌ها را با استفاده از فناوری گفتار به نوشتار و پردازش زبان طبیعی ارزیابی کنند تا اهداف تجاری خاصی مانند کنترل کیفیت فروش، درک آنچه مشتریان می‌گویند و نیاز دارند، دریافت فشارسنج احساسات و موارد دیگر را برآورده کنند.

یا برای مثال AESرا در نظر بگیرید، یک تولید کننده پیشرو در انرژی های تجدیدپذیر در ایالات متحده و در سراسر جهان. انرژی‌های تجدیدپذیر به ابزارهای بسیار بیشتری برای مدیریت و نظارت نسبت به انرژی سنتی نیاز دارد. اثربخشی عملیاتی سطح بعدی AESتوسط علم داده و هوش مصنوعی هدایت می‌شود که بینش‌های مبتنی بر داده را ارائه می‌دهد که اقدامات و تصمیمات مهندسان عملکرد را تکمیل می‌کند. این تضمین می‌کند که الزامات زمان کار برآورده می‌شوند و مشتریان انرژی‌های تجدیدپذیر را به سرعت، کارآمد و مقرون به صرفه دریافت می‌کنند. AES، مانند سوپرمن، وظیفه خود را برای نجات سیاره انجام می‌دهد.

اینها تنها تعداد کمی از بسیاری از کاربردهای هوش مصنوعی هستند که در حال حاضر در حال استفاده هستند. آن‌ها متمایز هستند زیرا تا کنون پتانسیل هوش مصنوعی توسط سه محدودیت عمده محدود شده است:

توان محاسباتی

به طور سنتی، سازمان‌ها فاقد قدرت محاسباتی مورد نیاز برای سوخت مدل‌های هوش مصنوعی و عملیاتی نگه داشتن آن‌ها بودند. شرکت‌ها در این فکر مانده‌اند که آیا باید برای منابع مورد نیاز خود فقط به محیط‌های ابری تکیه کنند یا اینکه سرمایه‌گذاری‌های محاسباتی خود را بین منابع ابری و منابع داخلی تقسیم کنند.

خوشه‌های GPUداخلی و داخلی اکنون گزینه‌هایی را در اختیار سازمان‌ها قرار می‌دهند. چندین شرکت بزرگ‌تر و پیشرفته در حال حاضر در حال بررسی موارد استفاده از تولید و درگیر شدن در کلاسترهای GPU خود هستند (یعنی NVIDIA DGX SuperPOD). خوشه‌های GPU اسب بخار اختصاصی مورد نیاز برای اجرای مدل‌های آموزشی عظیم را در اختیار سازمان‌ها قرار می‌دهند - تا زمانی که از معماری محاسباتی توزیع‌شده مبتنی بر نرم‌افزار استفاده کنند. چارچوبی از این نوع می‌تواند مشکلات تجزیه دستی بارهای آموزشی را در چندین گره GPUبرطرف کند.

داده‌های متمرکز

داده‌ها به طور سنتی در یک مکان متمرکز جمع‌آوری، پردازش و ذخیره می‌شوند که گاهی اوقات به عنوان انبار داده از آن یاد می‌شود تا یک منبع حقیقت واحد برای کسب‌وکارها ایجاد شود.

حفظ یک فروشگاه داده واحد، مقررات، نظارت و تکرار را ساده می کند. شرکت‌ها اکنون گزینه سرمایه‌گذاری در قابلیت محاسبات درون محل یا ابری را دارند، و اخیراً فشارهایی برای ایجاد انعطاف‌پذیری در انبار داده‌ها با تمرکززدایی داده‌ها صورت گرفته است.

مقررات محلی‌سازی داده‌ها می تواند جمع‌آوری داده‌ها از یک سازمان گسترده را غیرممکن کند. و یک آرایه رو به رشد سریع از موارد استفاده لبه برای مدل‌های داده، مفهوم انبارهای داده منحصربه‌فرد را تضعیف می‌کند.

داده‌های آموزشی

فقدان داده‌های خوب مانع اصلی گسترش هوش مصنوعی بوده است. در حالی که ما از لحاظ نظری توسط داده‌ها احاطه شده‌ایم، جمع‌آوری و نگهداری آن‌ها ممکن است زمان‌بر، پرزحمت و پرهزینه باشد. موضوع تعصب نیز وجود دارد. هنگام طراحی و استقرار مدل‌های هوش مصنوعی، آن‌ها باید متعادل و عاری از تعصب باشند تا اطمینان حاصل شود که بینش‌های ارزشمندی را ایجاد می‌کنند و در عین حال آسیبی ندارند. با این حال، داده‌ها، مانند دنیای واقعی، دارای سوگیری هستند. و اگر می‌خواهید استفاده از مدل‌ها را مقیاس‌بندی کنید، به داده‌های زیادی نیاز دارید.

برای رفع این مشکلات، کسب‌وکارها به داده‌های مصنوعی روی می‌آورند. در واقع، داده‌های مصنوعی در حال افزایش است. به گفته گارتنر، تا سال 2024، 60 درصد از داده‌های برنامه‌های کاربردی هوش مصنوعی مصنوعی خواهد بود. ماهیت داده‌ها (واقعی یا مصنوعی) برای دانشمندان داده بی‌اهمیت است. آنچه اهمیت دارد کیفیت داده است. داده‌های ترکیبی امکان تعصب یا سوگیری را از بین می‌برد. همچنین مقیاس‌پذیری آن ساده و تهیه آن کم هزینه است. کسب‌وکارها همچنین می‌توانند داده‌های از پیش برچسب‌گذاری‌شده را با داده‌های مصنوعی دریافت کنند، که به شدت زمان و منابع مورد نیاز برای ساخت و تولید مواد اولیه برای توسعه مدل‌های شما را کاهش می‌دهد.

این متن با استفاده از ربات ترجمه مقالات علم داده ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.