فوتبال معمولاً با نتیجه قضاوت میشود.
تیمی ۹۰ دقیقه بازی را در اختیار دارد، موقعیتهای بیشتری خلق میکند، بارها به دروازه حریف نزدیک میشود و در نهایت بازی را میبازد.
روی کاغذ همهچیز ساده به نظر میرسد: شکست خورده، پس تیم ضعیفتر بوده است.
اما آیا نتیجه واقعاً همیشه کیفیت بازی را نشان میدهد؟
این دقیقاً همان سؤالی است که یکی از مهمترین مفاهیم تحلیل داده در فوتبال مدرن را شکل داد: Expected Goals یا همان xG.
به زبان ساده، xG تلاش میکند به این سؤال پاسخ دهد:
اگر این موقعیت بارها تکرار شود، چند درصد مواقع تبدیل به گل خواهد شد؟
همه شوتها در فوتبال ارزش یکسانی ندارند.
یک ضربه از فاصله دو متری در مقابل دروازه، طبیعتاً بسیار خطرناکتر از شوتی از فاصله ۳۰ متری است. ما این موضوع را بهصورت شهودی میدانیم، اما xG این تفاوت را به زبان عدد ترجمه میکند.
برای مثال:
- ضربه پنالتی → حدود 0.76 xG
- ضربه سر از داخل محوطه → حدود 0.10 تا 0.15 xG
- شوت از بیرون محوطه جریمه → معمولاً کمتر از 0.05 xG
اگر تیمی در طول مسابقه مجموعاً ۲.۳ xG تولید کند، یعنی بر اساس کیفیت موقعیتهایی که ساخته، انتظار میرود بهطور میانگین حدود دو گل به ثمر برساند.
پایه بسیاری از مدلهای اولیه xG استفاده از رگرسیون لجستیک (Logistic Regression) بود.
ایده ساده است: مدل میخواهد احتمال گل شدن یک شوت را تخمین بزند.
بهصورت ریاضی:
P(goal) = σ(β₀ + β₁×distance + β₂×angle + β₃×shot_type + …)
تابع سیگموید خروجی را بین صفر و یک نگه میدارد؛ یعنی عددی که میتوان آن را بهعنوان احتمال گل شدن در نظر گرفت.
مدل معمولاً از متغیرهایی مثل این استفاده میکند:
- فاصله تا دروازه
- زاویه شوت نسبت به چارچوب
- نوع ضربه (پا یا سر)
- وضعیت بدن بازیکن هنگام ضربه
- تعداد مدافعان نزدیک
- نوع پاس منجر به شوت
- سرعت و نوع حمله
در سالهای اخیر مدلهای پیشرفتهتر از الگوریتمهایی مثل:
- Gradient Boosting
- Random Forest
- Neural Networks
- Bayesian Models
استفاده میکنند.
اما ایده اصلی ثابت مانده است:
پیشبینی احتمال یک رخداد دودویی؛ گل یا عدم گل.
مدلها با تحلیل صدها هزار یا حتی میلیونها شوت تاریخی یاد میگیرند چه الگوهایی معمولاً منجر به گل میشوند.
چون نتیجه کوتاهمدت همیشه تصویر دقیقی از عملکرد ارائه نمیدهد.
فرض کنید تیمی سه بازی متوالی را باخته است.
اگر فقط نتیجه را ببینیم، احتمالاً تصور میکنیم تیم دچار افت شده.
اما اگر در هر سه بازی xG تیم از حریف بالاتر بوده باشد، داستان متفاوت میشود.
این یعنی تیم همچنان موقعیتهای باکیفیت تولید میکند و شاید صرفاً در تمامکنندگی، تصمیمگیری نهایی یا حتی شانس، عملکرد مطلوبی نداشته است.
به همین دلیل xG تبدیل به ابزاری کلیدی در فوتبال مدرن شده است.
برای مربیان
مربی میتواند تشخیص دهد آیا ساختار تاکتیکی تیم واقعاً مؤثر است یا نتایج اخیر صرفاً حاصل نوسانات کوتاهمدت بودهاند.
برای باشگاهها
در نقلوانتقالات، صرفاً تعداد گل معیار مناسبی نیست.
بازیکنی که بهطور مداوم xG بالایی تولید میکند اما گلهای کمی زده، ممکن است مهاجمی باشد که صرفاً دورهای از بدشانسی را تجربه میکند.
برای تحلیل و پیشبینی
بسیاری از مدلهای پیشبینی نتایج مسابقات و تحلیل عملکرد تیمها، دادههای xG را بهعنوان یکی از مهمترین ورودیها استفاده میکنند.
مثل هر مدل آماری دیگر، xG هم محدودیتهای خودش را دارد.
۱. مدل معمولاً بازیکن را نمیبیند
نسخههای کلاسیک xG بیشتر روی موقعیت شوت تمرکز میکنند.
اگر دو بازیکن از یک نقطه مشابه شوت بزنند، مدل احتمال تقریباً یکسانی برای هر دو در نظر میگیرد.
اما در دنیای واقعی، شوت زدن بازیکنی مثل مسی با یک بازیکن معمولی قابل مقایسه نیست.
کیفیت تمامکنندگی، تکنیک فردی و تجربه بازیکن میتوانند نتیجه را تغییر دهند؛ چیزی که مدلهای ساده همیشه بهخوبی در نظر نمیگیرند.
۲. در نمونههای کوچک، نویز زیاد است
در یک مسابقه ممکن است اختلاف زیادی بین xG و نتیجه واقعی وجود داشته باشد.
این لزوماً به معنای اشتباه بودن مدل نیست.
فوتبال ذاتاً ورزشی با تعداد گل کم است و همین باعث میشود شانس در کوتاهمدت نقش بزرگی داشته باشد.
xG معمولاً در بازههای طولانیتر مثل نیمفصل یا یک فصل کامل معنا پیدا میکند.
۳. همه متغیرها قابل اندازهگیری نیستند
مدل نمیتواند تمام پیچیدگیهای فوتبال را ببیند.
برای مثال:
- خستگی بازیکن
- فشار روانی
- اعتمادبهنفس مهاجم
- کیفیت دریبل قبل از شوت
- شرایط مسابقه
- تصمیمگیری لحظهای
بسیاری از این عوامل یا قابل اندازهگیری نیستند یا داده کافی برای مدلسازی آنها وجود ندارد.
چیزی فراتر از فوتبال
جذابیت xG فقط به فوتبال محدود نمیشود.
از دیدگاه علم داده، xG نمونهای بسیار خوب از کاربرد یادگیری ماشین در مدلسازی عدم قطعیت در دنیای واقعی است.
همان ایدهای که در حوزههایی مثل:
- پیشبینی بازارهای مالی
- تشخیص پزشکی
- سیستمهای پیشنهاددهنده
- خودروهای خودران
هم استفاده میشود.
فوتبال فقط یکی از کاربردهای این نوع مدلسازی آماری است.
xG قرار نیست نتیجه مسابقه را پیشبینی کند.
قرار نیست جایگزین فوتبال واقعی شود.
اما کمک میکند چیزی را ببینیم که نتیجه نهایی اغلب پنهان میکند:
کیفیت واقعی عملکرد.
همان جمله معروف آماردان بزرگ جورج باکس:
“All models are wrong, but some are useful.”
xG هم دقیقاً یکی از همین مدلهاست.
کامل نیست.
اما یکی از مفیدترین ابزارهایی است که فوتبال مدرن برای فهم بهتر بازی در اختیار ما قرار داده است.
و شاید گاهی، نتیجه مسابقه کمتر از چیزی که فکر میکنیم حقیقت را بگوید.
Scholtes & Karakuş (2024) — Bayes-xG
Frontiers in Sports and Active Living
George E. P. Box (1976) — Science and Statistics
Journal of the American Statistical Association