Senior Data Scientist at SabaIdea (Filimo, Aparat, Cinematicket) | Founder Of: chistio.ir
۳منبع عالی برای به دست آوردن دادههای رایگان، جهت دادهکاوی و مهداده
یکی از مشکلات بسیاری از افراد فعال در حوزه داده کاوی و پردازشهای مهداده یا همان Big Data، پیدا کردن دادههای مناسب چه برای یادگیری و چه برای آزمایش الگوریتمهای مختلف است. نکته اصلی در منابع دادهای این است که آنها باید از دل دنیای واقعی استخراج شده باشند، نه به صورت مصنوعی ساخته شده باشند. در زیر چند منبع که از طریق آنها میتوانید دادههای مختلف جهت عملیات دادهکاوی، یادگیری ماشین و مهداده داشته باشید را آوردهایم:
- وب سایت UCI که یکی از معروفترین وب سایتها داده در جهان است. این دادهها با توجه به مسائل مختلف در دستههای مختلف جای گرفتهاند و میتوان از آنها در پروژهها استفاده نمود.
- اگر در حوزه اقتصادی فعالیت میکنید، وب سایت AssetMacro دادههای اقتصادی بسیار زیاد بر گرفته شده از دنیای واقعی را برای شما فراهم آورده است.
- اگر به حوزه ورزش و دادههای ورزشی علاقه مند هستید، وب سایت opensourcesport دادههای متنوعی از ورزشهای مختلف مانند فوتبال، بیسبال و... در اختیار شما قرار میدهد.
- دیتاستهای یاهو هم یکی از منابع ارزشمند موجود در وب هست
- لیستی از بقیه دیتاستها نیز در وبسایت Kdnuggets قرار داده شده است که میتوانید با توجه نیاز خود از آنها استفاده کنید
مطلبی دیگر از این انتشارات
چطور قدم به دنیای دیتاساینس بگذاریم؟
مطلبی دیگر از این انتشارات
گزارش تحلیلی اندازه بازار شهر هوشمند (پیشبینی سال ۲۰۲۳ میلادی)
مطلبی دیگر از این انتشارات
دسته بندی گلها با استفاده از خوشه بندی k-means در ML.NET(قسمت 5)