기대 득점(xG) 모델을 소개하는 칼럼이 하나 있길래 번역을 해봤습니다. 사실 생각보다 별 내용은 없는 편이긴 한데... 이 글은 xG에 대한 소개글이고, 이후 xGOT에 대한 소개글까지 번역을 해볼 생각입니다.
https://theanalyst.com/eu/2021/06/what-are-expected-goals-xg/
의역, 오역의 가능성이 있습니다. 양해 부탁드립니다.
최근 몇년간 데이터와 통계는 축구계에서 점점 널리 활용되고 있고 있다. 그것의 최전선에는 기대 득점(expected goals, xG)이 있다. xG가 2012년 옵타에서 소개된 이후, 이 지표는 축구 분석계에서 가장 광범위하고 통찰력 있는 지표 중 하나가 되었다.
일찍이 베팅 업계에서 이것이 도입된 이후, 이제 기대 득점은 스카이스포츠나 BBC Match of the day 같은 주류 방송계에서 활용될 정도로 주요한 지표가 되었다. xG는 분석가의 랩톱 컴퓨터에서 뛰쳐나와 이제는 프리미어리그 감독들의 입까지 도달했다. 최근 리버풀의 위르겐 클롭은 그들의 기대 득점 값을 맨체스터 시티의 것과 비교했었고, 아스톤 빌라의 딘 스미스는 본인의 팀 퍼포먼스를 강조할 때 이 수치를 종종 사용하곤 한다.
기대 득점은 일반 축구 팬들 사이에서 발전된 지표로서 가장 먼저 알려진 지표 중 하나이며, 필연적으로 몇년 동안 비판들에 직면해왔다. 경기를 전통적으로 바라보는 관점과 데이터로 분석하는 관점 가운데서, 우리가 판단을 내리기 전에 이 데이터 지표가 어떻게 계산되고 활용되는지 이해하는 것이 중요하다.
기대 득점(xG)이란 무엇인가?
기대 득점(혹은 xG)은 특정한 플레이 단계와 특정한 경기장 위치에서 득점으로 이어질 확률을 계산하여 기회의 질을 측정한다. 이 값은 슈팅이 이어지기 전 몇몇 요소들을 기반으로 한다. xG는 0~1의 값을 가지며 0은 득점이 불가능한 상황을, 1은 선수가 확실하게 득점할 수 있는 기회를 뜻한다.
우리는 하프라인과 박스 안에서의 득점 기회가 같지 않다는 것을 알고 있다. xG을 이용해서 우리는 선수가 각각의 상황에서 맞이한 득점 기회를 수량화할 수 있다. 예를 들어, 박스 안에서 0.1의 xG 값을 가진 기회를 가정해보자. 이것은 평균적인 선수가 10번의 슈팅에서 1골을 득점할 수 있다는 의미이거나 득점 확률이 10%라는 것을 뜻한다.
용어가 생소할 수 있지만, 축구 팬이나 해설자들은 몇년 전부터 기대 득점의 개념을 소개해오고 있었다. "10번 중 9번 정도는 넣을 기회였다." 혹은 "이 정도면 이번 경기에서 해트트릭을 했어야 했다."라던가 말이다.
일반적인 오해
기대 득점에 대한 주된 비판은 이 지표가 실제로 정확하게 적용되지 않을 때 일어난다. 가장 일반적인 경우는 게임 수준의 문제이다. xG 값이 더 높은 팀이 반드시 이겼어야 했다는 이야기가 아니다. xG 값은 기회의 품질을 측정할 뿐이지 경기의 결과를 예측하는 것이 아니다. 오래된 격언에서 이야기하듯, 골은 경기를 바꾸고 스코어 라인은 팀이 경기를 하는 방식을 바꾼다. 팀이 일찍 리드를 잡으면, 그들에겐 많은 찬스를 만드는 것이 필수적이지는 않다. 보통 상대팀이 만회골을 위해 골 찬스를 더 많이 만드는 것을 자주 볼 수 있다.
또다른 오해는 문자 그대로 해석할 때의 문제이다. 우리는 예측대로의 값을 정확하게 기대하지 않는다. 또한 몇몇 소수점 값의 골들은 득점되지 않는다. '기대 득점'이라는 이름은 기대값이라는 수학적인 개념에서 도출된 것이고 결과가 발생하는 가능성을 계산하는 것이다. 동전을 튕기면 앞면이 나올 확률도, 뒷면이 나올 확률도 50%다. (기대값은 각각 0.5) 우리는 동전을 던질 때 정확하게 절반씩 앞면과 뒷면이 나올 것이라 예상하지 않는다. 하지만 동전을 계속해서 던지다보면 점점 더 중간값에 가까워질 가능성이 있다. 이것은 기대 득점에도 마찬가지로 적용된다. 기대값에서의 편차는 필연적인 것이고 이것은 우리가 축구에서 분석할 수 있는 가치있는 정보이다.
xG 값을 초과수행한 선수나 팀은 반드시 평균값으로 수렴할 필요가 없다. 이것은 도박사의 오류로 알려진 개념이다. 우리는 그들이 결국 기대골 값으로 수렴할 것이라 예상하지만, 그들은 이미 초과수행 값을 저장해둔 상태이며 따라서 앞으로도 초과수행된 값만큼 시즌 통계에서 앞서나갈 것이라 예측된다. 이건 동전 던지기에서도 마찬가지이다. 10번 연속 앞면이 나왔다 하더라도 앞으로 앞면과 뒷면이 나올 확률은 동일하다. 10번 연속 앞면이 나온 것은 이미 일어난 일일 뿐이기 때문이다.
기대 득점 값은 어떻게 계산되는가?
경기를 보다보면 직관적으로 득점 확률이 높은지 낮은지 알 수 있다. 얼마나 가까이에서 슈팅하는가, 좋은 각도에서 슈팅했는가, 1대1 찬스였는가, 헤더였는가.
각각의 상황에서 경기당 평균 25개의 슈팅의 가능성을 평가하는 것은 어려운 일이다. 기대 득점 모델의 장점은 위에서 살펴본 변수와 다른 것들이 득점에 미치는 영향을 정량화할 수 있다는 점이다. 이것을 통해 2019-20 시즌 프리미어리그의 9,398개 슈팅을 몇초 만에 분석할 수 있다.
Stats Perform의 xG 모델은 Opta에 기록된 수십만개의 슈팅을 기반으로 하여 로지스틱 회귀 분석을 활용해 구축되었고, 득점에 영향을 미치는 다양한 변수들을 통합하여 계산된다.
- 골대와의 거리
- 골대와의 각도
- 1대1 여부
- 빅 찬스
- 신체 부위 (머리나 발 등)
- 어시스트 종류 (스루 패스, 크로스 등)
- 플레이 패턴 (오픈 플레이, 속공, 프리킥, 코너킥, 스로인 등)
몇몇 상황은 특별하기 때문에 독립적으로 모델링되기도 한다. 페널티 킥 같은 경우 고정된 0.79의 기대 득점 값을 갖는다. 직접 프리킥 역시 별도의 모델을 갖고 있으며, 헤더 찬스는 세트 피스와 오픈 플레이에서의 값이 다르게 계산된다.
(그 다음은 대충 최근에는 더 여러가지 변수를 추가시키면서 xG 모델이 점점 개량되고 있다는 이야기)
기대 득점 값을 어떻게 사용할 수 있는가?
19-20 시즌, 프리미어리그 맨체스터 시티의 가브리엘 제수스와 세리에 A AC 밀란의 하칸 찰하노글루를 비교해보자. 두 선수 모두 PK를 제외하면 정확하게 100개의 슈팅을 시도했지만 제수스는 14골, 찰하노글루는 8골을 기록했다. 이 둘의 슈팅에는 무슨 차이가 있었을까?
각각 100개의 기회들을 분석함으로써 xG 값은 유효슈팅이나 평균 슛 거리 같은 전통적인 지표를 넘어선 맥락을 설명해줄 수 있다.
가브리엘 제수스의 기회들에서 우리는 17.7의 xG 값을 보고 평균적인 선수라면 18골 정도를 득점했을 것이라 예상할 수 있다. 반면 하칸 찰하노글루의 기회들에서는 7골을 득점했을 것이라 기대할 수 있다. 우리는 왜 둘의 득점이 이렇게 다른지 빠르게 이해할 수 있다. 물론 제수스나 찰하노글루 모두 약간의 오차가 있지만, 같은 100번의 기회에서의 퀄리티는 아주 달랐고 실제 득점 결과는 그것을 반영하고 있다.
우리는 두 선수의 득점 찬스의 평균 퀄리티값인 슈팅당 기대득점을 살펴보며 두 선수의 샷 프로필을 비교할 수 있다. 가브리엘 제수스는 0.18의 슈팅당 xG를 기록했으며, 이는 그가 평균적으로 5번의 슈팅마다 1골을 득점했을 것이라 예상할 수 있다. 찰하노글루의 적극적인 성향은 그보다 훨씬 낮은 0.07의 xG 값을 기록하게 만들었으며 이 성향은 위의 슈팅맵을 봐도 명백하다. 더 높은 크기의 점은 더 높은 xG 값의 슈팅을 의미하기 때문이다. (그리고 이것은 득점과도 마찬가지로 연결된다.)
여기서는 개별적인 선수들의 예로 이야기했지만, 기대 득점 공식은 팀이나 경기에도 유사한 방식을 통해 적용될 수 있다. 물론, 우리는 그들이 기록한 xG 값보다 더 많은 혹은 더 적은 득점을 기록하는 것을 자주 볼 수 있다. 그것은 통계적인 편차의 이야기지만 말이다. 선수가 기대했던 것보다 더 낮은 득점 득점을 기록하고 있는가? 누가 더 높은 xG 상황에서 기회를 얻고 있는가?
기대 득점의 깊이
축구는 상대적으로 적은 득점이 발생하는 스포츠다. 그렇기에 득점 상황과 관련된 환경을 측정하고 분석하는 능력은 필수적인 맥락이다. 기대 득점은 전문가와 분석가들에게 축구 팬들이 듣고 싶어하는 이야기들을 정량적으로 표현할 수 있게하는 도구가 될 수 있다. 어떤 스트라이커가 마무리에 어려움을 겪고 있는가? 어떤 팀의 폼이 그들의 리그 순위보다 과소평가되고 있는가?
(그 다음은 대충 Stats Perform이 아주 열일하고 있다는 이야기)
기대 득점(xG)는 전통적인 득점 수를 넘어선 지표이지만, 이것 또한 단순한 지표에 지나지 않는다는 점을 염두해두어야 한다. 우리는 숨겨진 퍼포먼스를 평가하기 위해 이것을 활용할 수 있지만, 실제 축구에서 경기를 승리하게 하는 것은 기대 득점이 아닌 실제 득점이다. 축구는 예측하기 힘든 스포츠고 골은 예측하지 못한 결과에서 나오는 것이지만, 기대 득점은 우리가 이러한 경향성들이 얼마나 우연적인 것이었냐를 설명해 줄 수 있을 것이다.