ویرگول
ورودثبت نام
علی مهدوی راد
علی مهدوی راد
علی مهدوی راد
علی مهدوی راد
خواندن ۴ دقیقه·۱ روز پیش

وقتی نتیجه دروغ می‌گوید؛ علم داده پشت مفهوم xG در فوتبال

فوتبال معمولاً با نتیجه قضاوت می‌شود.

تیمی ۹۰ دقیقه بازی را در اختیار دارد، موقعیت‌های بیشتری خلق می‌کند، بارها به دروازه حریف نزدیک می‌شود و در نهایت بازی را می‌بازد.

روی کاغذ همه‌چیز ساده به نظر می‌رسد: شکست خورده، پس تیم ضعیف‌تر بوده است.

اما آیا نتیجه واقعاً همیشه کیفیت بازی را نشان می‌دهد؟

این دقیقاً همان سؤالی است که یکی از مهم‌ترین مفاهیم تحلیل داده در فوتبال مدرن را شکل داد: Expected Goals یا همان xG.


xG دقیقاً چیست؟

به زبان ساده، xG تلاش می‌کند به این سؤال پاسخ دهد:

اگر این موقعیت بارها تکرار شود، چند درصد مواقع تبدیل به گل خواهد شد؟

همه شوت‌ها در فوتبال ارزش یکسانی ندارند.

یک ضربه از فاصله دو متری در مقابل دروازه، طبیعتاً بسیار خطرناک‌تر از شوتی از فاصله ۳۰ متری است. ما این موضوع را به‌صورت شهودی می‌دانیم، اما xG این تفاوت را به زبان عدد ترجمه می‌کند.

برای مثال:

- ضربه پنالتی → حدود 0.76 xG

- ضربه سر از داخل محوطه → حدود 0.10 تا 0.15 xG

- شوت از بیرون محوطه جریمه → معمولاً کمتر از 0.05 xG

اگر تیمی در طول مسابقه مجموعاً ۲.۳ xG تولید کند، یعنی بر اساس کیفیت موقعیت‌هایی که ساخته، انتظار می‌رود به‌طور میانگین حدود دو گل به ثمر برساند.


xG چگونه محاسبه می‌شود؟

پایه بسیاری از مدل‌های اولیه xG استفاده از رگرسیون لجستیک (Logistic Regression) بود.

ایده ساده است: مدل می‌خواهد احتمال گل شدن یک شوت را تخمین بزند.

به‌صورت ریاضی:

P(goal) = σ(β₀ + β₁×distance + β₂×angle + β₃×shot_type + …)

تابع سیگموید خروجی را بین صفر و یک نگه می‌دارد؛ یعنی عددی که می‌توان آن را به‌عنوان احتمال گل شدن در نظر گرفت.

مدل معمولاً از متغیرهایی مثل این استفاده می‌کند:

- فاصله تا دروازه

- زاویه شوت نسبت به چارچوب

- نوع ضربه (پا یا سر)

- وضعیت بدن بازیکن هنگام ضربه

- تعداد مدافعان نزدیک

- نوع پاس منجر به شوت

- سرعت و نوع حمله

در سال‌های اخیر مدل‌های پیشرفته‌تر از الگوریتم‌هایی مثل:

- Gradient Boosting

- Random Forest

- Neural Networks

- Bayesian Models

استفاده می‌کنند.

اما ایده اصلی ثابت مانده است:

پیش‌بینی احتمال یک رخداد دودویی؛ گل یا عدم گل.

مدل‌ها با تحلیل صدها هزار یا حتی میلیون‌ها شوت تاریخی یاد می‌گیرند چه الگوهایی معمولاً منجر به گل می‌شوند.


چرا xG اهمیت دارد؟

چون نتیجه کوتاه‌مدت همیشه تصویر دقیقی از عملکرد ارائه نمی‌دهد.

فرض کنید تیمی سه بازی متوالی را باخته است.

اگر فقط نتیجه را ببینیم، احتمالاً تصور می‌کنیم تیم دچار افت شده.

اما اگر در هر سه بازی xG تیم از حریف بالاتر بوده باشد، داستان متفاوت می‌شود.

این یعنی تیم همچنان موقعیت‌های باکیفیت تولید می‌کند و شاید صرفاً در تمام‌کنندگی، تصمیم‌گیری نهایی یا حتی شانس، عملکرد مطلوبی نداشته است.

به همین دلیل xG تبدیل به ابزاری کلیدی در فوتبال مدرن شده است.

برای مربیان

مربی می‌تواند تشخیص دهد آیا ساختار تاکتیکی تیم واقعاً مؤثر است یا نتایج اخیر صرفاً حاصل نوسانات کوتاه‌مدت بوده‌اند.

برای باشگاه‌ها

در نقل‌وانتقالات، صرفاً تعداد گل معیار مناسبی نیست.

بازیکنی که به‌طور مداوم xG بالایی تولید می‌کند اما گل‌های کمی زده، ممکن است مهاجمی باشد که صرفاً دوره‌ای از بدشانسی را تجربه می‌کند.

برای تحلیل و پیش‌بینی

بسیاری از مدل‌های پیش‌بینی نتایج مسابقات و تحلیل عملکرد تیم‌ها، داده‌های xG را به‌عنوان یکی از مهم‌ترین ورودی‌ها استفاده می‌کنند.


اما xG کامل نیست

مثل هر مدل آماری دیگر، xG هم محدودیت‌های خودش را دارد.

۱. مدل معمولاً بازیکن را نمی‌بیند

نسخه‌های کلاسیک xG بیشتر روی موقعیت شوت تمرکز می‌کنند.

اگر دو بازیکن از یک نقطه مشابه شوت بزنند، مدل احتمال تقریباً یکسانی برای هر دو در نظر می‌گیرد.

اما در دنیای واقعی، شوت زدن بازیکنی مثل مسی با یک بازیکن معمولی قابل مقایسه نیست.

کیفیت تمام‌کنندگی، تکنیک فردی و تجربه بازیکن می‌توانند نتیجه را تغییر دهند؛ چیزی که مدل‌های ساده همیشه به‌خوبی در نظر نمی‌گیرند.

۲. در نمونه‌های کوچک، نویز زیاد است

در یک مسابقه ممکن است اختلاف زیادی بین xG و نتیجه واقعی وجود داشته باشد.

این لزوماً به معنای اشتباه بودن مدل نیست.

فوتبال ذاتاً ورزشی با تعداد گل کم است و همین باعث می‌شود شانس در کوتاه‌مدت نقش بزرگی داشته باشد.

xG معمولاً در بازه‌های طولانی‌تر مثل نیم‌فصل یا یک فصل کامل معنا پیدا می‌کند.

۳. همه متغیرها قابل اندازه‌گیری نیستند

مدل نمی‌تواند تمام پیچیدگی‌های فوتبال را ببیند.

برای مثال:

- خستگی بازیکن

- فشار روانی

- اعتمادبه‌نفس مهاجم

- کیفیت دریبل قبل از شوت

- شرایط مسابقه

- تصمیم‌گیری لحظه‌ای

بسیاری از این عوامل یا قابل اندازه‌گیری نیستند یا داده کافی برای مدل‌سازی آن‌ها وجود ندارد.


چیزی فراتر از فوتبال

جذابیت xG فقط به فوتبال محدود نمی‌شود.

از دیدگاه علم داده، xG نمونه‌ای بسیار خوب از کاربرد یادگیری ماشین در مدل‌سازی عدم قطعیت در دنیای واقعی است.

همان ایده‌ای که در حوزه‌هایی مثل:

- پیش‌بینی بازارهای مالی

- تشخیص پزشکی

- سیستم‌های پیشنهاددهنده

- خودروهای خودران

هم استفاده می‌شود.

فوتبال فقط یکی از کاربردهای این نوع مدل‌سازی آماری است.


جمع‌بندی

xG قرار نیست نتیجه مسابقه را پیش‌بینی کند.

قرار نیست جایگزین فوتبال واقعی شود.

اما کمک می‌کند چیزی را ببینیم که نتیجه نهایی اغلب پنهان می‌کند:

کیفیت واقعی عملکرد.

همان جمله معروف آماردان بزرگ جورج باکس:

“All models are wrong, but some are useful.”

xG هم دقیقاً یکی از همین مدل‌هاست.

کامل نیست.

اما یکی از مفیدترین ابزارهایی است که فوتبال مدرن برای فهم بهتر بازی در اختیار ما قرار داده است.

و شاید گاهی، نتیجه مسابقه کمتر از چیزی که فکر می‌کنیم حقیقت را بگوید.


منابع

Scholtes & Karakuş (2024) — Bayes-xG

Frontiers in Sports and Active Living

George E. P. Box (1976) — Science and Statistics

Journal of the American Statistical Association

فوتبالneural networksیادگیری ماشین
۰
۰
علی مهدوی راد
علی مهدوی راد
شاید از این پست‌ها خوشتان بیاید