ویرگول
ورودثبت نام
ایمان محدثی
ایمان محدثی
ایمان محدثی
ایمان محدثی
خواندن ۸ دقیقه·۱۳ ساعت پیش

جلسه دوم از علم داده: علم داده در عمل

علم داده در عمل

کاربرد علم داده با توجه به اینکه روش ها و دیدگاه هایی از سایر رشته ها از قبیل ریاضی ، آمار و علم کامپیوتر دارد، شامل طیف وسیعی از رشته های دیگر می شود. علم داده در تجارت ، سیاست عمومی ، سلامتی و پزشکی و مهندسی و علوم و همچنین در ورزش و سرگرمی کاربرد دارد.

علم داده در تجارت

علم داده نقش کلیدی در خیلی از کسب و کار ها دارد. انواع گوناگونی از داده های مرتبط با مشتریان ، محصولات و فروش در این حوزه را می توان تولید و جمع آوری کرد. این داده ها شامل لیستی از نام مشتریان و محصولاتی که خرید کرده اند و اینکه در قبال خرید چه سودی برای کسب و کار مرتبط داشته است. تحلیل داده های تجاری باعث افزایش سود و منفعت صاحبان کسب و کارها می شود.

خرده فروشی بزرگ Walmart برای استفاده از تحلیل های تجاری و گسترش سود سالیانه اش شناخته شده است. Walmart چندین پتابایت داده ( یک پتابایت = 1024 ترابایت ) از داده های غیرساختاریافته که هر ساعت از میلیون ها مشتری تولید می شوند را جمع آوری می کند( big data ). داده های مشتریان Walmart شامل بیش از 255 میلیون ویزیت از وب سایت Walmart در یک هفته می شود. پس Walmart بر اساس همین big data ، الگوهای مشتریان رو شناسایی می کند و موجودی کالاها رو منطبق بر آن الگوها به روزرسانی می کند. نتیجه تحلیل این داده های مشتیریان این شد که Walmart توانست مقدار فروش آنلاین را حدود 10 تا 15 درصد تخمین بزند که همین مقدار سود یک میلیارد دلاری را برای Walmart رقم زد ( 2024 ).

آمازون مثال خوب دیگری است. آمازون همیشه تمرکزش بر به حداقل رساندن زمان تحویل کالا و هزینه ها بوده است.همانند Walmart، به تحلیل الگوهای مصرف کنندگان پرداخت و موفق شد محصولات به مشتریان مورد نظر نزدیک کند. کاری آمازون توانست بر اساس الگوهای استخراج شده از مشتریان بدست آورد باعث که ایالات متحده را به 8 منطقه جغرافیایی تقسیم کند و در هر قسمت بر اساس الگوهای فروش آن منطقه کالاهایی را در انبار کالا قرار بدهد که این امر باعث شد که زمان تحویل کالا به مشتری و هزینه ارسال کالا کاهش پیدا کند. نتیجه این استخراج بینش از داده های مشتریان افزایش 76 درصدی ارسال به موقع کالا با کمترین هزینه شد.

مثالی دیگر از آمازون استفاده به کار بردن الگوریتم های یادگیری ماشین برای پیش بینی کالاهایی که ممکن است در هر منطقه مشتریان سفارش دهند.

علم داده بطور گسترده ای در امور مالی نیز استفاده می شود. امروزه تشخیص تقلب در تراکنش های مالی با استفاده از الگوریتم های یادگیری ماشین مدیریت می شوند. مبتنی بر تراکنش های قبلی مشتریان و الگوهای قبلی متقلبانه ، یک الگوریتم یادگیری ماشین تراکنش های جعلی را بصورت  بلادرنگ تشخیص می دهد.

علم داده در مهندسی و علم

رشته های متنوعی از مهندسی و علم از علم داده سود می برند. اینترنت اشیا ( IoT) یک مثال خوب از پارادایم جدید فناوری است که از علم داده سود می برد. اینترنت اشیاء توصیفی از تعامل اشیاء مختلف از طریق اینترنت است. علم داده یک نقش حیاتی در این تعاملات بین اشیاء بازی می کند چرا که رفتار اشیاء در شبکه اغلب بر اثر داده های جمع آوری شده در شبکه های دیگر می باشد. به مثال دوربین های مداربسته یا زنگ در خانه هوشمند به به ما این اجازه را می دهند که بصورت زنده تصاویر را نگاه کنیم و در صورتی که فعالیت غیر معمولی در محل رخ بده به ما اطلاع بدهد.

پیش بینی آب و هوا  یک فعالیت داده محور است که تحلیل گران این حوزه داده های مختلف از جمله دما و رطوبت را جمع آوری می کنند و سپس بر اساس آن داده ها آب و هوا را در آینده تخمین می زنند.علم داده پیش بینی آب و هوا را با استفاده از روش های پیچیده پیش بینی همانند تحلیل سری های زمانی (Time Series Forecasting ) ، تصمیم گیری با استفاده از یادگیری ماشین ( Decision-making using Machine Learning Basics ) و یادگیری عمیق و هوش منوعی (Deep Learing and AI Basics ) نیز قابل اعتماد تر کرده است.این پیشرفت در پیش بینی آب و هوا مهندسان و دانشمندان را در پیش بینی بلایای طبیعی مانند سیل یا آتش سوزی به شدت کمک کرده است. در بخش کشاورزی نیز استفاده از علم داده و پیشی بینی آب و هوا نجات بخش بسیاری از کشاورزان خواهد بود.

علم داده در سیاست عمومی

شهرهای هوشمند نمایشی از استفاده علم داده در سیاست عمومی است. شهر Masdar در ایالات متحده عربی و Songdo در کره جنوبی هزاران سنسور جمع آوری داده برای بهینه کردن انرژی نصب کرده اند. هر چند که هنوز این فناوری در این شهرها کامل نیست ولی شرکت های بزرگ با فشار سیاست های دولت حاکم بر استفاده این فناوری تاکید دارند( Clewlow 2024 ). این سیاست شهر هوشمند در مقایس های کوچک در حال انجام است مانند استفاده در پارکینگ خودروها ، ساختمان ها یا چراغ های شهری .به عنوان مثال شهر San Diego هزاران سنسور برای کنترل چراغ های خیابان با استفاده از علم داده و فناوری های هوشمند نصب کرده است.سنسورهای دیگر با اندازه گیری ترافیک ، گنجایش پارکینگ ها ، دما و رطوبت و غیره می توانند در مدیریت شهر های بزرگ کمک کنند.

علم داده در آموزش

علم داده همچنین آموزش را تحت تاثیر قرار داده است. در آموزش سنتی مخصوصا در مقاطع تحصیلی بالا ، آموزش در کلاس به این صورت است که آموزگار برای تمامی دانش آموزان به یک ضرب آهنگی مطالب درس را ارائه می کند به این معنی که همه دانش آموزان در هر سطحی باید فقط به سخنرانی آموزگار گوش بدهند.این نوع از آموزش برای پیگیری پیشرفت دانش آموزان برای آموزگار غیر ممکن است. این روز ها برخی از کلاس ها بصورت مجازی و آنلاین برگزار می شوند و آموزگار می تواند با استفاده از پلتفرم های آموزشی و داده های جمع آوری شده روند پیشرفت دانش آموزان را پیگیری کند.

علم داده در خدمات درمانی و پزشکی

علم داده در خدمات درمانی و پزشکی اغلب برای تشخیص و درمان با استفاده از تحلیل های پیش گویانه استفاده می شود. تحلیل داده ها تاریخی و استفاده از روش های آماری ، یادگیری ماشین و الگوریتم ها در تشخیص زود هنگام بیماری های افراد می تواند کمک کننده باشد. تشخیص پزشکی و نسخه نویسی برای بیمار معمولا با توضیحات شفاهی علائم و درد خود بیمار می باشد که پزشک بر اساس آن و تجربه ای کسب نموده است ، نسخه درمانی را می نویسد. جنبش استفاده از علم داده در خدمات درمانی و پزشکی به افرادی که در این حوزه فعالیت می کنند کمک خواهد کرد و در آینده باید بیشتر تصمیم گیری و تشخیص نوع بیماری بر اساس داده ها صورت گیرد. امروزه تصمیم گیری داده محور میسر تر شده است و این را باید مدیون داده هایی باشیم که از گجت های شخصی ، تلفن های هوشمند ، ساعات های هوشمند و مچ بندهای هوشمند جمع آوری شده است. این قبیل دستگاه ها بصورت روزانه رکورد های  سلامتی  را جمع آوری می کنند و پزشکان بر اساس آن رکوردها می توانند موقیعت بیمار را رصد کنند. در این صورت پزشک بیماری را  دقیق تر و مبتنی بر فرد تشخیص خواهد داد و نسخه دقیقا برای فرد نوشته خواهد شد.

کاربرد دیگر علم داده در خدمات درمانی و پزشکی کاهش هزینه سرویس درمانی است. با استفاده از رکوردهای تاریخی علائم بیماری و تجویز نسخه آن بیماری ، یک چت بات هوش مصنوعی می تواند خدمات پزشکی را بصورت خودکار و با کمترین هزینه انجام دهد که نیاز حضور بیماران به پزشکان را کاهش خواهد داد.

علم داده در ورزش و سرگرمی

علم داده در ورزش و سرگرمی متداول شده است. ورزش بطور طبیعی داده های خیلی زیادی تولید می کند؛ داده هایی از بازیکنان ، موقیعت بازی ، تیم ها ، فصل ها و از قبیل داده ها .تحلیل این داده ها در ورزش تحلیل ورزش (Sport Analytics ) نامیده می شود. برای مثال، تیم بیسبال Oakland Athletics ، استخدام بازیکنان برای فصل 2002 را بطرز عالی تحلیل کرد.مدیریت تیم یک روش آماری موسوم به sabermetrics برای استخدام و موقیعت بازیکنان استفاده کرد. تیم با بودجه بسیار ناچیزیش نسبت به سایر تیم ها توانست بازیکنان بارزش را با کمترین بودجه خریداری کند و در نتیجه آن فصل مهیج ترین تیم در لیگ آمریکا شدند. این داستان بسیار درامتیک بود به نحوی که Michael Lewis یک کتاب در مورد آن نوشت و بعدا یک فیلم با نام Moneyball، بر اساس این ساخته شد.

در صنعت سرگرمی، علم داده بطور معمول برای پیشنهادات شخصی سازی شده ای که بعنوان سیستم های پیشنهاده دهنده  ( Recommendation Systems ) هستند شناخته شده می باشند. برای مثال ما می توانیم از Netflix یاد کنیم. محققان Netflix بر اساس داده های مشترکان و علاقه مندی آنان ویدیو های مورد نظر را در دسترسی بیشتر قرار می دهد.

تمایلات و مشکلات در علم داده

فناوری، جمع آوری حجم عظیمی از داده ها  را به سادگی ممکن کرده و ما امروز با چالش پردازش و تحلیل این حجم از داده ها روبرو هستیم. اما خود فناوری باز در نقش نجات دهنده وارد بازی شد و دانشمندان داده اکنون با استفاده از یادگیری ماشین داده ها را بیشتر می فهمند و هوش مصنوعی فرایند داده محور تصمیم گیری را خودکار سازی می کند.

با این پیشرفت ها ، خیلی از مردم در مورد اخلاق و حریم خصوصی گلایه دارند. چه کسی اجازه داده که این داده ها جمع آوری شوند و چه کسی اجازه دسترسی به آنان را داده است؟ هیچکدام از ما نمی خواهیم که دیگران از داده های خصوصی ما مانند اطلاعات تماس ، رکوردهای سلامتی ، لوکیشن ، تصاویر و تاریخچه جستجو در وب بدون اطلاع استفاده کنند. الگوریتم های یادگیری ماشین و هوش مصنوعی بر اساس داده های گذشته آموزش داده شده اند و خود این داده های گذشته ممکن است شامل سوگیری هایی باشد که این امر نیز باعث می شود که تصمیمات و نتایجی که یادگیری ماشین و هوش مصنوعی هم می دهند شامل سوگیری و نتایج غیر قابل اعتماد باشند. بنابراین پردازش و جمع آوری داده ها  و ارزیابی آن ها باید با دقت لازم صورت پذیرد.

یادگیری ماشینمتخصص علم دادهآنالیز دادههوش مصنوعی
۰
۰
ایمان محدثی
ایمان محدثی
شاید از این پست‌ها خوشتان بیاید