۳منبع عالی برای به دست آوردن داده‌های رایگان، جهت داده‌کاوی و مه‌داده


یکی از مشکلات بسیاری از افراد فعال در حوزه داده کاوی و پردازش‌های مه‌داده یا همان Big Data، پیدا کردن داده‌های مناسب چه برای یادگیری و چه برای آزمایش الگوریتم‌های مختلف است. نکته اصلی در منابع داده‌ای این است که آن‌ها باید از دل دنیای واقعی استخراج شده باشند، نه به صورت مصنوعی ساخته شده باشند. در زیر چند منبع که از طریق آن‌ها می‌توانید داده‌های مختلف جهت عملیات داده‌کاوی، یادگیری ماشین و مه‌داده داشته باشید را آورده‌ایم:

  1. وب سایت UCI که یکی از معروف‌ترین وب سایت‌ها داده در جهان است. این داده‌ها با توجه به مسائل مختلف در دسته‌های مختلف جای گرفته‌اند و می‌توان از آن‌ها در پروژه‌ها استفاده نمود.
  1. اگر در حوزه اقتصادی فعالیت می‌کنید، وب سایت AssetMacro داده‌های اقتصادی بسیار زیاد بر گرفته شده از دنیای واقعی را برای شما فراهم آورده است.
  2. اگر به حوزه ورزش و داده‌های ورزشی علاقه مند هستید، وب سایت opensourcesport داده‌های متنوعی از ورزش‌های مختلف مانند فوتبال، بیس‌بال و... در اختیار شما قرار می‌دهد.
  3. دیتاست‌های یاهو هم یکی از منابع ارزشمند موجود در وب هست
  4. لیستی از بقیه دیتاست‌ها نیز در وب‌سایت Kdnuggets قرار داده شده است که می‌توانید با توجه نیاز خود از آن‌ها استفاده کنید