지난해 10월 대전 구장에서 펼쳐진 챔피언 결정전 5차 경기에서, 엘지 팀이 한화를 물리치고 정상에 올랐다. 흥미로운 점은 시즌 시작 팀의 우승을 점친 분석가가 명도 없었다는 사실이다.
프로야구 시즌 전망이 계속 빗나가는 까닭
2026년 프로야구 개막이 이제 3주 앞으로 성큼 다가왔다. 매년 이맘때면 구단의 성적 예상이 봇물처럼 쏟아진다. 티비 방송부터 신문, 인터넷 영상까지 가릴 없다. 팬들 역시 어느 팀이 강하고 약한지, 상위권 경쟁에 누가 합류할지 열띤 토론을 벌인다. 조회수를 끌어모으는 최고의 소재다.
그런데 매년 시즌 성적을 정확히 맞추는 전문가는 거의 찾아볼 없다. 사실 맞추는 불가능에 가깝다. 해설자나 기자들의 역량이 부족해서가 아니다. 그들은 경기를 설명하고 기사를 쓰는 사람이지, 미래를 내다보는 예언가가 아니기 때문이다. 야구를 비롯한 스포츠는 사람이 하는 게임이라 예상 밖의 일이 자주 벌어진다. 이것이 바로 스포츠의 진짜 매력이다.
작년 ‘최강 팀’으로 꼽혔던 케이아이에이의 결말
지난해 케이아이에이가 대표적 사례다. 개막 전만 해도 팀은 ‘압도적 1위 후보’로 평가받았다. 전년도 정규 시즌과 최종 우승을 모두 차지한 팀이었고, 외국인 선수 구성도 리그 최상급이었다. 자유계약으로 불펜 투수 장현식을 엘지에 보냈지만, 키움에서 마무리 투수 조상우를 데려오며 약점이 거의 없어 보였다. 무엇보다 선수층이 다른 구단과 비교가 만큼 두터웠다.
하지만 결과는 8위였다.
케이아이에이는 과거 차례 우승 다음 모두 5위를 기록한 전례가 있어, 팬들 사이에선 우승 다음 시즌에 대한 걱정이 있었다. 그러나 2025년 성적은 그보다 훨씬 나빴다. 전년도 최우수선수 김도영을 포함한 핵심 선수들이 연달아 다쳤고, 외국인 선수들도 기대치에 미쳤다.
결국 개막 분석이 틀렸다기보다, 분석의 전제 조건 자체가 현실에서 무너진 셈이다.
데이터로 분석한 시즌 전망 방법
필자는 지난해 ‘야구×수학’이라는 책에서 2025시즌 성적 전망을 시도했다. 흔한 방송 예상이 아니라, 데이터 분석을 바탕으로 전력 평가 모델을 만들어 책으로 정리한 작업이었다.
2024년 대체선수 대비 승리기여도(WAR, 스탯티즈 기준)를 기준으로 구단별 상위 30명을 집계했다. 30명을 기준으로 삼은 이유는 포스트시즌 엔트리 30명을 고려한 것이다.
새로 영입한 외국인 선수의 승리기여도는 재계약 외국인 선수 가장 낮은 수치를 적용했다. 투수는 드류 앤더슨(에스에스지)의 3.86, 타자는 빅터 레이예스(롯데)의 3.40이다. 2024년 외국인 선수 평균 승리기여도는 투수 4.45, 타자 3.64인데 이를 그대로 쓰면 과대평가될 우려가 있어 재계약 선수 최저치를 반영했다.
외국인 선수 성적, 순위 예측의 최대 변수
순위 예측이 어려운 가장 이유 하나가 바로 외국인 선수의 불확실성이다. 새로 영입한 선수든 기존 선수든 다음 시즌 성적을 정확히 예측하기 어렵다. 문제는 이들의 비중이 매우 크다는 점이다.
구단별 30명 선수의 승리기여도를 합치면 삼성, 엘지, 케이아이에이가 상위 3강을 형성했다. 그리고 두산부터 에스에스지까지가 빽빽한 중위권을 이루고, 키움이 단독 최하위로 나타났다. 지난해는 상위 3강, 중위 6팀, 하위 1팀의 구도가 예상됐다.
전년도 승리기여도를 바탕으로 하기 때문에 선수의 나이에 따른 기량 변화나 부상, 갑작스러운 실력 상승 또는 하락은 담기지 않는다. 이를 보완하기 위해 전문가 예상을 더했다. 방송 해설위원 5명과 10년 이상 경력 기자 5명의 예상 순위를 반영했다. 일종의 데이터 보정 작업이다.
승리기여도 합산 수치와 전문가 예상에 각각 0.7과 0.3을 곱해 합산했다. 프로야구 올스타 선정 방식(팬 70%, 선수단 30%)을 참고한 것이다.
최종적으로 승리기여도(70%)와 전문가 예상(30%)을 합치면 2025시즌 예상 순위는 1위 케이아이에이 69.067점, 2위 삼성 65.581점, 3위 엘지 64.631점으로 상위 3강을 이루고, 4위 케이티 53.057점, 5위 두산 51.527점, 6위 한화 49.326점, 7위 롯데 41.402점, 8위 에스에스지 41.388점, 9위 엔씨 40.496점으로 중위 6팀(4~6위와 7~9위는 중강, 중약으로 구분 가능), 10위 키움 22.355점으로 하위 1팀을 형성했다.
승리기여도 상위 30명을 합한 순위와 비교하면 상위 3강, 중위 6팀, 하위 1팀 구조는 동일하고 순위만 약간 달라졌다.
이 방식은 전문가 예상이 경험과 직관에 기댈 수밖에 없어 주관이 들어갈 있고, 데이터 역시 현실의 다양한 변수를 담기 어렵다는 점에서 접근을 서로 보완하려는 시도였다.
데이터와 전문가 경험을 합쳐도 맞히기 어려운 순위
그러나 방식 역시 결과는 빗나갔다.