این اولین مقاله از مجموعه مقالاتی است که قصد دارد یادگیری ماشین(Machine Learning) را برای کسانی که آموزش فنی ندارند،در اختیار بگذارد.
امیدوارم مفید باشد.
دنیا پر از داده است. داده های بسیار زیاد.همه چیز شامل تصاویر، موسیقی، کلمات، صفحات گسترده، ویدیوها و موارد دیگر و به نظر نمیرسد به این زودی ها رو به فرسایش حرکت کند.
پیشرفتهای فناوری رایانه در دهههای گذشته سبب شده که جمعآوری دادههای الکترونیکی در بیشتر زمینه ها رایجتر شود.بسیاری از سازمانها در حال حاضر خود را مدعی نگهداری مقادیر زیادی از دادهها در سالهای گذشته میدانند. این دادهها میتوانند به افراد، تراکنشهای مالی، اطلاعات بیولوژیکی و بسیاری موارد دیگر مربوط باشند. به طور همزمان، دانشمندان داده برنامههای کامپیوتری تکراری به نام الگوریتم را توسعه دادهاند که میتوانند به این حجم انبوه از دادهها دسترسی داشته باشند، آنها را تجزیه و تحلیل کنند و الگوها و روابطی را که توسط انسان قابل شناسایی نیست، شناسایی کنند. تجزیه و تحلیل پدیدههای گذشته میتواند اطلاعات بسیار ارزشمندی در مورد آنچه در آینده از همان پدیدهها یا پدیدههای نزدیک به هم مرتبط است، ارائه دهد. از این نظر، این الگوریتم ها که بر خلاف الگوریتم های معمولی، خروجی آنها مبتنی بر داده است، می توانند از گذشته درس بگیرند و از این یادگیری برای پیش بینی های مفید در آینده استفاده کنند.به زبانی دیگر یادگیری ماشین این نوید را می دهد که از همه ی داده هایی که در اختیار دارد معنایی یافت کند. به عنوان مثال می توانید یک مدل پیش بینی قیمت برای آپارتمان ها داشته باشید. آنها را با روندها و قیمت های گذشته آموزش دهید. سپس از الگوریتم میپرسید که قیمت در پنج سال آینده چقدر خواهد بود! یا می توانید سیستمی را با 100 هزار ایمیل اسپم آموزش دهید و سپس پیام های جدید را بر اساس تجزیه و تحلیل انجام شده توسط ماشین فیلتر کنید. به طور خلاصه، ما دستگاه را با دادههای آزمایشی عظیم آموزش میدهیم و سپس آن را به ورودی انتقال میدهیم تا نتیجه را دریافت کنیم.
در ابتدا ما مفاهیمی با سطح بالا را آغاز کرده و سپس به جزئیات فنی میپردازیم.
آرتور سی کلارک(Arthur C. Clarke):
"هر فناوری که به اندازه کافی تکامل یافته و پیشرفته است را نمیتوان از سحر و جادو تمایزش داد".
به طور سنتی، انسان ها داده ها را تجزیه و تحلیل کرده و سیستم ها را با تغییرات در الگوهای داده، تطبیق داده اند. با این حال، از آنجایی که حجم دادهها از توانایی انسان برای درک آن و نوشتن دستی قوانین فراتر میرود، به طور فزایندهای به سیستمهای خودکاری روی میآوریم که میتوانند از دادهها یاد بگیرند، و مهمتر از همه، تغییرات در دادهها، برای انطباق با چشم اندازِ دادههای در حال تغییر اند.
یادگیری ماشین در حال حاضر در همه جا وجود دارد. ما امروزه در محصولاتی که امروزه از آن استفاده می کنیم، یادگیری ماشین را در اطراف خود می بینیم، اما همیشه برای ما آشکار نیست که یادگیری ماشین پشت همه چیز است. در حالی که تگ کردن اشیا و افراد در تصاویر به وضوح یادگیری ماشین است، ممکن است متوجه نباشید که ویژگیهایی مانند سیستمهای پیشنهادی ویدیویی نیز اغلب توسط یادگیری ماشین ارائه میشوند. البته، شاید بزرگترین مثال، جستجوی گوگل باشد. هر بار که از جستجوی Google استفاده میکنید، از سیستمی استفاده میکنید که سیستمهای یادگیری ماشین زیادی را در هسته خود دارد، از درک متن درخواستتان گرفته تا تنظیم نتایج بر اساس علایق شخصیتان. وقتی «جاوا» را جستجو میکنید، یادگیری ماشین بسته به اینکه فکر میکند متخصص قهوه هستید یا توسعهدهنده، تعیین میکند کدام نتایج ابتدا نشان داده شود. شاید شما هر دو باشید!
امروزه، کاربردهای فوری یادگیری ماشین بسیار گسترده است، از جمله تشخیص تصویر، تشخیص تقلب، موتورهای پیشنهاد دهنده ، و همچنین سیستم های متن و گفتار.
این قابلیتهای قدرتمند را میتوان در طیف وسیعی از زمینهها، از رتینوپاتی دیابتی و تشخیص سرطان پوست گرفته تا خردهفروشی، و البته حملونقل، در قالب خودروهای خودران و self parking به کار برد.
خیلی از آن زمان نگذشته که وقتی یک شرکت یا محصول دارای یادگیری ماشینی بود، جدید به حساب می آمد. اکنون هر شرکتی به دنبال استفاده از یادگیری ماشینی در محصولات خود است. این به سرعت در حال تبدیل شدن به یک ویژگی مورد انتظار است. همانطور که انتظار داریم شرکتها وبسایتی داشته باشند که روی دستگاه تلفن همراه یا اپلیکیشن ما کار میکند، به زودی روزی فرا میرسد که انتظار میرود فناوری ما شخصیسازی شده، روشنگر و خود اصلاح شود. همانطور که ازn(Machine Learning)MLبرای بهتر کردن، سریعتر یا آسانتر کردن وظایف انسانی موجود استفاده میکنیم، میتوانیم به آینده نگاه کنیم، زمانی که ML میتواند به ما کمک کند کارهایی را انجام دهیم که هرگز نمیتوانستیم به تنهایی به آنها برسیم.
خوشبختانه، استفاده از مزیت یادگیری ماشین سخت نیست. ابزار ها بسیار کارآمد شده اند. تنها چیزی که نیاز دارید داده ها، توسعه دهندگان و تمایل به غرق در کار شدن است.
"استفاده از داده ها برای پاسخ به سوالات"
البته این یک سادهسازی اغراق آمیز است، اما همچنان میتواند هدف ثمر بخشی در پیش داشته باشد. به طور خاص، میتوانیم تعریف را به دو بخش «استفاده از داده» و «پاسخ به سؤالات» تقسیم کنیم. این دو بخش به طور کلی دو جنبه یادگیری ماشین را نشان می دهند که هر دو به یک اندازه مهم هستند. «استفاده از دادهها» چیزی است که معمولاً «آموزش» نامیده میشود، در حالی که «پاسخ به سؤالات» به عنوان «پیشبینی» یا «نتیجه گیری» نامیده میشود. آنچه این دو قسمت را به هم متصل می کند الگو است. ما الگو را آموزش می دهیم تا با استفاده از مجموعه داده های خود، پیش بینی های بهتر و مفیدتری را انجام دهد. سپس این مدل پیشبینی میتواند برای ارائه پیشبینیها بر روی دادههای دیده نشده قبلی به کار گرفته شود.
همانطور که ممکن است متوجه شده باشید،
مؤلفه کلیدی این فرآیند، داده است. داده ها کلید باز کردن قفل یادگیری ماشین هستند، همانطور که یادگیری ماشین، کلید باز کردن پیش بینی پنهان موجود در داده ها است.
بعد چی؟
این فقط یک نمای کلی در سطح بالایی از یادگیری ماشین، چرایی مفید بودن آن و برخی از کاربردهای آن بود. یادگیری ماشین حوزه وسیعی است که مجموعه کاملی از تکنیک ها را برای استنباط پاسخ از داده ها در بر می گیرد. در آینده، هدف این است که به شما درک بهتری از رویکردی که برای یک مجموعه داده و سؤالی که میخواهید به آن پاسخ دهید، استفاده کنید و همچنین ابزارهایی را برای نحوه انجام آن ارائه خواهیم کرد. در گام بعد، ما مستقیماً به فرآیند ملموس انجام ML با جزئیات بیشتر می پردازیم، و یک فرمول گام به گام برای نحوه نزدیک شدن به مشکلات یادگیری ماشین را مرور می کنیم.