داریوش مهدی پور یقینی
داریوش مهدی پور یقینی
خواندن ۱ دقیقه·۱ سال پیش

دیتا ست!

یکی دیگر از چالش هایی که پیش بینی می کردیم تو مسیر اینچیه بهش بر بخوریم، چالش و یا بهتره بگم ابر چالش دیتا ست (Data set) هستش. دیتاست ها مجموعه ای از داده ها هستن که در فرآیند یادگیری ماشین استفاده می شن. هر نمونه در دیتا ست مستقل از سایر نمونه هاست و ستون های دیتا ست هم ویژگی های خاصی رو نشون می دن. دیتا ست ها در بحث یادگیری ماشین و توسعه ی سیستم های هوشمند واقعا نقش مهمی ایفا می کنن. عملا ماشین چیزی رو یاد میگیره که دیتاست به خوردش می ده.

چیزی که ما تو اینچیه قراره بهش برسیم مدلی هوشمند برای کلاس بندی تصاویر هستش. ماشین یه تصویر رو از کاربر می گیره و کلاس هایی که این تصویر بهشون اختصاص داره رو به عنوان خروجی می ده. مثلا اگه عکس یه اردک به مدل داده بشه باید بتونه تشخصی بده که تصویر یک حیوان، یک پرنده و در نهایت اردک هستش و کلاس های اونو به عنوان خروجی نمایش بده.

برای اینکه همچین مدلی داشته باشیم باید از روش های یادگیری ماشین با ناظر مدل مون رو آموزش بدیم. برای این نوع آموزش هم باید دیتا ست مون شامل نمونه ها و تارگت هاشون باشه. یعنی هر نمونه کلاس هایی که بهش تعلق داره هم مشخص بشه. هرچه تعداد نمونه های دیتا ست بیشتر باشه مدل هوشمند عملکرد بهتری تو تشخیص خواهد داشت. در ادامه این مسیر باید بگردیم و دیتا ست های مناسب این کار رو پیدا کنیم. شاید هم مجبور بشیم خودمون دیتا ست هایی رو تولید کنیم.


منبع: اینچیه

یادگیری ماشیندیتادیتاست
مدرس دانشگاه، مولف کتاب، برنامه نویس، عاشق هوش مصنوعی مخصوصا یادگیری عمیق، کتاب و مسافرت و گشت و گذار تو طبیعت مخصوصا بکرش رو هم خیلی دوست دارم.
شاید از این پست‌ها خوشتان بیاید