در قسمت قبلی در مورد ماتریس کوواریانس صحبت کردیم و یک مثال در مورد نمرات درسی یک کلاس را مثال زدیم. دراین قسمت بیشتر وارد کدهای متلب می شویم. فرض کنید میخواهیم که رفتار کلاس را برای زمانی که 1000 دانشجو داریم شبیه سازی کنیم. برای این حالت باید بتوانیم بر اساس داده های اندکی که داریم(5 دانشجو) رفتار دیگران را شبیه سازی کنیم. برای این کار کافی است میانگین و کواریانس حساب شده را به تابع نرمال چند متغیره بدهیم. البته همانطور که میدانید حتی نیاز نداریم که میانگین و واریانس را روی کاغذ حل کنیم همه کارها را خود متلب انجام میدهد. در برنامه زیر تابع mean بر روی ماتریس نمرات(scores) عمل کرده و میانگین هر ستون(هر درس در یک ستون بود) را محاسبه می کند. پس میانگین یک بردار سه تایی است. به برنامه زیر دقت کنید:
نمودار زیر نشان می دهد که چگونه 1000 داده ی تولید شده در فضا پخش شده اند( هر بعد نشان دهنده یک درس است).
مثال درس ها ممکن است برای شما ملموس باشد اما چندان کاربردی به نظر نمی رسد. در این قسمت می خواهیم بر روی مجموعه داده ی بزرگ تری کار کنیم. این مجموعه داده به نام iris شناخته می شود و شامل اطلاعاتی در مورد سه نوع زنبق بر اساس طول و عرض کاسبرگ و طول و عرض گلبرگ آن هاست(ویژگی ها: طول کاسبرگ، عرض کاسبرگ، طول گلبرگ، عرض گلبرگ). 50 نمونه مختلف از هر سه نوع زنبق اندازه گیری شده است که در کل 150 نمونه داریم. این مجموعه داده کلاسیک است و در خود متلب به صورت پیش فرض وجود دارد. با زدن دستور زیر می توانید به آن دسترسی پیدا کنید:
Iris_dataset
در این جا می خواهیم با داشتن همین 150 نمونه تعداد 10000 نمونه از این گل را شبیه سازی و تولید کنیم. در ضمن می خواهیم به رابطه بین ویژگی های این مجموعه داده پی ببریم. ابتدا با استفاده از برنامه زیر کواریانس را محاسبه می کنیم:
در ابتدا مجموعه داده را به صورت ستونی باید در آوردیم (با ترانهاده کردن ماتریس مجموعه داده). و در مرحله بعد کوواریانس آن را محاسبه کردیم. در اینجا ترتیب ویژگی ها به همان صورتی است که گفتیم. بنابراین میزان کوواریانس طول کاسبرگ و طول گلبرگ برابر است با 1.2737
در نهایت با استفاده از برنامه زیر می توان 10000 نمونه را ایجاد و رسم کرد:
توجه کنید که در اینجا تنها سه بعد اول مجموعه داده ایریس را نشان داده ایم. توجه کنید تا کنون به کلاس هر نمونه (این که چه نوع گلی است) توجه نکردیم چون هنوز به مساله دسته بندی کاری نداریم. در مثال های بعدی این موضوع روشن تر می شود.