داده‌های نرمال شده/نرمال‌سازی

منتشرشده در statisticshowto
لینک مقاله اصلی: Normalized Data / Normalization

درباره داده‌های نرمال شده

کلمه «نرمال سازی» به طور غیر رسمی در آمار به کار می‌رود و بنابراین اصطلاح داده‌های نرمال شده می‌تواند معانی متعددی داشته باشد. در اغلب موارد، زمانی که داده‌ها را نرمال می‌کنید، واحدهای اندازه‌گیری داده را حذف می‌کنید و این موضوع به شما این امکان را می‌دهد که داده‌ها از مکان‌های مختلف را مقایسه کنید. برخی از روش‌های رایج برای نرمال کردن داده‌ها عبارتند از:

  • تغییر داده‌ها با استفاده از z-score یا t-score. این امر معمولا استانداردسازی نامیده می‌شود. در اکثر موارد، اگر یک کتاب آمار در مورد نرمال سازی داده‌ها صحبت کند، این تعریف از «نرمال سازی» را استفاده می‌کند.
  • مقیاس‌بندی مجدد داده‌ها برای اینکه مقادیری بین ۰ و ۱ داشته باشند. این معمولا مقیاس گذاری ویژگی نامیده می‌شود. یک فرمول ممکن برای رسیدن به این هدف این است:
  • استاندارد کردن باقیمانده‌ها: نرخ‌های بکاررفته در تحلیل رگرسیون می‌تواند باقیمانده‌ها را به شکل یک توزیع نرمال درآورد.
  • گشتاورهای نرمال با استفاده از فرمول μ / σ.
  • نرمال سازی بردارها (در جبر خطی) به نرم یک بردار: نرمال سازی در این حالت به معنای تبدیل یک بردار است به طوری که طول یک بردار را داشته باشد.

این لیست به هیچ وجه جامع نیست. من رایج‌ترین موارد را در آن گنجاندم، اما آگاه باشید که معانی بسیار و بسیار دیگری برای واژه نرمال سازی وجود دارد.

نرمال سازی در برابر استانداردسازی

اصطلاحات نرمال سازی و استاندارد سازی گاهی اوقات به جای هم به کار می‌روند، اما آن‌ها معمولا به چیزهای مختلفی اشاره می‌کنند. نرمال سازی معمولا به معنای مقیاس‌بندی یک متغیر برای داشتن مقادیر بین ۰ و ۱ است، در حالی که استانداردسازی داده‌ها را به داشتن میانگین صفر و انحراف معیار ۱ تبدیل می‌کند. این استاندارد سازی z-score نامیده می‌شود، و نقاط داده را می توان با فرمول زیر استاندارد کرد:

یک z-score متغیرها را استاندارد می‌کند.

که در آن

  • xi یک نقطه داده (x1، x2 … xn) است.
  • x̄ میانگین نمونه است.
  • s انحراف معیار نمونه است.

z-scoreها در آمار خیلی رایج هستند. آن‌ها به شما این امکان را می‌دهند که مجموعه‌های مختلف داده را مقایسه کرده و احتمالات مجموعه داده‌ها را با استفاده از جداول استاندارد پیدا کنید (جدول z نامیده می‌شود).

این متن با استفاده از ربات ترجمه مقاله علمی ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.