در ستایش آمار، علم داده‌ها

رابرت تیبشیرانی استاد آمار و علوم داده‌های زیستی در دانشگاه استنفورد است. او یکی از پرافتخارترین افراد در حوزه‌ی آمار است و بیش‌تر بخاطر ابداع روش LASSO معروف است. اگر تعداد ارجاع به مقالات نشانه‌ی برتری یک پژوهش‌گر باشد تیبشیرانی با تعداد «۲۸۷۱۲۴» ارجاعی که تا کنون به مقاله‌هایش شده، برترین پژوهش‌گر در حوزه‌های آمار، یادگیری ماشین و علم داده‌هاست!

Robert Tibshirani. Image courtesy of Rod Searcey (photographer).
Robert Tibshirani. Image courtesy of Rod Searcey (photographer).

با جستجوی بیشتر درباره این فرد، می‌توان دید تیبشیرانی در صفحه‌ی شخصی خود متنی در باب علاقه‌اش به آمار و اهمیت این رشته نوشته که ترجمه‌ی آن به شرح زیر است:

در دوران راهنمایی و دبیرستان، من علاقه‌ی زیادی به ریاضیات داشتم. در دوران لیسانس در دانشگاه، من بیشتر درس‌های مربوط به ریاضیات و علوم کامپیوتر را اخذ می‌کردم. پس از مدتی متوجه شدم - برای من - ریاضیات بیش‌ازحد انتزاعی است و علوم کامپیوتر بیش‌ازحد درگیر جزئیات ریز است (مثل تلاش برای کم کردن چندصدم ثانیه از محاسبات یا کم کردن چند کیلوبایت از حجم پردازشی). من آمار را علمی یافتم که برای حل مسائل واقعی اطرافمان، زیبایی‌های هردو رشته‌ی ریاضی و علوم کامپیوتر را با هم ترکیب کرده است. امروزه آمار از هر زمان دیگری پراهمیت‌تر است؛ به‌دلیل اینکه امروزه قادریم به‌راحتی حجم زیادی از داده‌ها را جمع‌آوری کنیم. چالش آمار این است که در میان این داده‌ها الگوهایی معنادار پیدا کند. اکنون این چالش در بسیاری از زمینه‌ها مثل علوم، مهندسی، پزشکی، امور مالی و حتی هنر کاربرد دارد. آمار یک علم جوان است و هنوز در حال شکل‌گیری است. اکنون بدلیل وجود سیستم‌های پردازشی عظیم، زمان بسیار خوبی برای آماردان شدن است. این‌که چگونه از ابزارهای موجود استفاده کنیم چالش بنیادی در این رشته است و تمرکز من نیز پژوهش در باب این موضوع است.

تیبشیرانی تعبیر قشنگی از آمار دارد: علمی که زیبایی‌های ریاضیات و علوم کامپیوتر را با هم ترکیب کرده است!