تو پست قبلی گفتم ما مفهومی داریم
به نام دیتاست که داده های قابل پردازش(Train) ما هستن ;
ما باید داده هامون رو تا حد ممکن برای یادگیری ماشین آماده و تمیز کنیم .
اصلا کار سختی نیست فقط نیازه که این مراحل رو یاد بگیرید و همیشه وقتی دیتاست جدید بهتون میرسه باهاش پیش برید .
اسم این مراحل هست Data Preprocessing .


اصلا نیازی نیست که الان شما با این عکس بالا ارتباطی برقرار کنید :) نگران مفاهمیش نباشید الکی هم جزوه برداری نکنید :)
خلاصه که توی این مرحله ما باید اینکار ها رو بکنیم و مقاله تمامی این مراحل موجوده :
Data Cleaning
حذف مقادیر گمشده (Missing Values)
حذف یا اصلاح دادههای پرت (Outliers)
Train-Test Split
یک کتاب هم میتونم اینجا معرفی کنم که اگه دوست داشیتید یک مکمل کنارتون باشه میتونه گزینه خوبی باشه :
Hands On Data Pre-processing in Python by Roy Jafari
همین و تمام , تشریف بیارید مقاله بعدی .