Senior Data Scientist at SabaIdea (Filimo, Aparat, Cinematicket) | Founder Of: chistio.ir
۳منبع عالی برای به دست آوردن دادههای رایگان، جهت دادهکاوی و مهداده
یکی از مشکلات بسیاری از افراد فعال در حوزه داده کاوی و پردازشهای مهداده یا همان Big Data، پیدا کردن دادههای مناسب چه برای یادگیری و چه برای آزمایش الگوریتمهای مختلف است. نکته اصلی در منابع دادهای این است که آنها باید از دل دنیای واقعی استخراج شده باشند، نه به صورت مصنوعی ساخته شده باشند. در زیر چند منبع که از طریق آنها میتوانید دادههای مختلف جهت عملیات دادهکاوی، یادگیری ماشین و مهداده داشته باشید را آوردهایم:
- وب سایت UCI که یکی از معروفترین وب سایتها داده در جهان است. این دادهها با توجه به مسائل مختلف در دستههای مختلف جای گرفتهاند و میتوان از آنها در پروژهها استفاده نمود.
- اگر در حوزه اقتصادی فعالیت میکنید، وب سایت AssetMacro دادههای اقتصادی بسیار زیاد بر گرفته شده از دنیای واقعی را برای شما فراهم آورده است.
- اگر به حوزه ورزش و دادههای ورزشی علاقه مند هستید، وب سایت opensourcesport دادههای متنوعی از ورزشهای مختلف مانند فوتبال، بیسبال و... در اختیار شما قرار میدهد.
- دیتاستهای یاهو هم یکی از منابع ارزشمند موجود در وب هست
- لیستی از بقیه دیتاستها نیز در وبسایت Kdnuggets قرار داده شده است که میتوانید با توجه نیاز خود از آنها استفاده کنید
مطلبی دیگر از این انتشارات
از «ویژگی» چه می دانید؟ (قسمت اول)
مطلبی دیگر از این انتشارات
سیستم های پیشنهاد دهنده برای ویرگول؟
مطلبی دیگر از این انتشارات
۶ نکته در یادگیری برنامهنویسی که کمک میکنه برنامهنویس بهتری باشید