야구

최고의 구종(구질)을 찾아서

retriever 2008. 2. 28. 08:52
Searching for the game’s best pitch
by John Walsh
February 26, 2008

원문을 보시려면 여기로

산타나의 체인지업일까? 파펠본의 포심일까? 어쩌면 파우스토 카모나의 지저분한 싱커일수도 있고, 마리아노 리베라의 신비스럽기까지 한 커터일 수도 있다. 스몰츠의 슬라이더와 조쉬 베켓의 커브도 후보군이다. 그렇지 않은가? 자 그러면, 누구의 공이 최고의 구질이라 할 수 있을까?

음, 나 역시 다른 사람들처럼, 이런 문제에 대해서 생각을 하게 되면, 어느정도의 분석으로 누구나가 어떤 견해를 가질 수 있다고 생각한다. 기록을 분석해서 게임에서 최고의 구질을 가려내는 분별력있는 방법에 무엇이 있을까? 문제는 얼마나 '분별력'이 있느냐인데, 결과를 도출해내기 전까지는 어떤 순위도 '분별력'을 가진다고 보기 어려울 것이다. 그러니, 한번 결과 도출을 향해 출발해보자.


이 녀석이 가장 지저분한 공을 던질까?

단일 투구의 가치

먼저 여기서 알고 넘어가야 할 점은 단일 투구의 가치이다. 그 공이 바로 타격으로 이어진다면, 그 결과로서 그 가치를 가늠해 볼 수 있을 것이다. 우리가 '가치'를 논할때, 나는 '득점 개념'을 활용한다. 내가 사용할 스캣은 'Batting Runs'라는 것인데, 이 글을 읽는 몇몇 분들이 태어나기도 전에 피터 팔머에 의해 개념이 정립되었다. 어쨌든 'Batting Runs'는 'Linear weights'로도 알려져 있는데, 역사상 가장 최악의 명명이라고 할 수 있을 것 같다.

어쨌든 batting runs는 타자들의 득점생산력을 넘어서 단일 선수들의 득점 생산력을 측정하는 방법이다. 득점의 가치를 타격에 들어섰을때의 다양한 결과들과 매칭을 시키는 것이다. 이를테면, 싱글안타는 평균 0.5점 이하의 가치를 지니고, 볼넷은 1/3 점, 아웃은 약 -0.25점 등등이다. 이러한 가치 평가에 대한 방법을 알고 싶다면, (이것이 바로 악명높은 linear weights이다.) 좋은 참고자료가 될만한 것은 짐 알버트와 제이 베넷에 의해 씌여진 'Curve Ball'이다.  

좋다. 타격이 되었다면 아무런 문제가 없다. 하지만 타격없이 볼이나 스트라이크가 되어버린 경우의 가치는 어떻게 될까? 약 20%의 투구만이 타격으로 이어진다. 따라서, 우리는 남은 80% 공의 가치에 대해서 파악을 해야 한다. 자, 그럼 우리는 득점 가치를 볼과 스트라이크에 매칭을 시켜 보자. 사실 Hardball Times Baseball Annual 2008에서 플래툰의 영향을 분석한 기사에서 이미 한번 알아본 경험이 있다. 읽어보지 않았더라면, 한번 지금 읽어보시길 바란다.

타격으로 이어지지 않은 공들에 대한 가치를 판단하는 방법은 이것이다. 명심해야 할 점은 볼의 경우 타자에게 유리한 방향으로 카운트가 흘러가고, 스트라이크의 경우는 반대이다. 어떤 특정 카운트에서 타자들이 얼마나 잘 대처해내는지를 파악해보면, 그 가치를 가늠할 수 있을 것이다. 자 예시를 보아가면서 살펴보자, 그것이 가장 효과적인 방법이니까.

평균 수준의 한 타자가 타석에 들어선다. 처음엔 당연히 노스트라이크 노볼. 2007년 타자 평균이라고 한다면, .268/.336/.423 이었다. 이렇게 표현할 수 있다.  

0-0 count: .268/.336/.423

좋다, 자 그럼 투수가 첫 번째 공을 던져서 카운트가 1-0이 되었다고 생각해 보자. 1-0 카운트에 이르면 타자는 자연스럽게 평균(0-0카운트)보다 잘 치게 된다. 기록은 이렇다.

1-0 count: .282/.394/.459

첫 번째 공이 볼일 경우 타자에게 다소 유리한 경우가 된다. 죠니 페랄타가 그래디 사이즈모어가 된다는 소리.
그렇다면 첫 번째 공이 볼이 아니라 스트라이크라면? 자, 볼카운트 0-1에서 타자들이 얼마나 위축이 되는지 보자.

0-1 count: .238/.282/.362

정말 큰 차이다. 죠니 페랄타가 토니 페냐가 되어버린 경우.

득점을 기준으로 논의하기 위해 위에서 보여준 AVG/OBP/SLG 대신 각각의 카운트에 대해서 batting runs의 가치를 활용해보자. 실제로, 12개의 가능한 볼카운트 각각에 대해서 batting runs는 다음과 같다.


위에서 보여준 예를 살펴보면, 첫 번째 스트라이크는 -0.044점(물론 타자에게)의 가치가 있다. 반면 첫 번째 볼은 평균 0.038점의 가치를 지닌다. 위의 표를 쭈욱 살펴보면, 각각의 카운트마다 볼과 스트라이크의 가치가 서로 상이하다는 것을 알 수 있다. 다음 테이블은 주어진 카운트에서 볼과 스트라이크가 어떤 가치를 지니는지를 보여주고 있다.


당연하게도, 가장 가치가 큰 투구는 볼카운트 3-2에서 발생한다. 볼은 바로 볼넷으로 이어지고, 스트라이크는 삼진으로 이어지는 카운트이기 때문이다.

우리는 이제 야구에서 가장 뛰어난 투구를 찾아 나설 준비가 되었지만, 잠시 타격이 이루어진 투구들에 대해 좀 살펴볼 필요가 있다. 이미 위에서 논의된 것처럼, 타격이 이루어진 공들이 얼만큼의 가치를 지니는지 알고 있지만, 그 가치는 평균 타자들에 대해 상대적인 개념이다. 즉, 0-0카운트에서의 가치를 의미한다.

만약에 타자가 0-2카운트에서 안타를 쳐낸다면, 그 싱글 안타의 가치는 일반적인 0.47점의 가치보다 높다. 이미 0-2 카운트에서의 득점 가치(run value)는 -0.106점이고, Table 1에서 확인한 바 있다. 이 경우 안타의 가치는 0.58점 정도이다. 카운트(-0.106)의 영향 때문에 마지막 득점 가치인 0.47점에서 최초의 득점 가치(-0.106)를 뺀다. 타격이 이루어진 공의 모든 평가는 이런식으로 이루어질 것이다. 타격이 이루어진 공에 대해서는 batting runs에 의해 타석에 들어섰을때의 가치에서 그 볼카운트의 가치를 뺀 값이 될 것이다.


두명의 좋은 투수들과 여섯 구질들



좋다, 이 논의에 감을 좀 잡기 위해 두명의 투수를 한번 거들떠 보자. 지난해 사이영상 수상자인 제이크 피비부터 시작해볼까. 아래 테이블은 피비의 세가지 구종의 가치를 보여준다. 100개의 투구당 평균 이상인 득점의 관점으로 표현되었다.(100을 평균으로 +는 그 이상) 음수는 곧 평균보다 적은 득점을 허용한다는 것을 의미한다.

Notation:
NP - number of pitches(투구수)
runs100 - runs per 100 pitches(100투구당 득점)
nip - not-in-play(타격상황이 아닐때)
ip - in-play(타격 상황)
tot - all pitches(모든 투구)

보시다시피, 타격상황이 아닌 경우와 타격 상황의 경우로 결과를 나누었다. 타격으로 이루어지지 않는 경우, 피비의 최고의 구질은 커브로 드러났다. 반면, 타격이 이루어진 경우(물론 홈런을 포함한다.), 직구가 가장 효과적인 공이었다. 전체적으로, 물론 살펴볼테지만, 피비의 직구와 커브는 내가 분석해본 투구 데이터에서 가장 뛰어난 구질 중 두가지이다. 자, 다른 투수로 넘어가보자.


산타나의 체인지업이 그의 가장 효과적인 구질로 보인다. 뭐 이미 예상했던 일이긴 하지만, 실제로 직구와 슬라이더보다도 좋았다. 자 이제, 한 투구의 득점 가치에 대해서 감을 좀 잡았으리라 생각하고, 누가 게임에서 최고의 구질(투구)을 가졌는지 알아보자.

Fastballs

누가 가장 뛰어난 직구를 가지고 있는가? 의견이 분분하겠지만, 지금 내가 할 수 있는 것은 그저 2007년에 누가 가장 효과적인 직구를 던졌는지 보여주는 것 뿐이다.

나의 투구 분류법은 포심, 커터나 싱커를 따로 구분하지 않고, 모두 다 ‘직구’로 규정한다. 또한 나는 최소 500개 이상의 직구를 구사한 투수만을 포함시켰다. 하지만, pitch-f/x 데이터가 완전하지 않은 관계로, 실제로 모든 투수들이 다 이 분석에 포함되어 있다고 보긴 어렵다. 어쨌든 120명의 투수들은 나의 샘플에 포함될만큼 충분한 공을 던졌다.

2007년 기준으로 직구 순위 탑20이다.


Notation:
NP - number of pitches
runs100 - runs per 100 pitches
nip - not-in-play
ip - in-play
tot - all pitches

파드레스의 셋업맨 히쓰 벨은 pitch-f/x데이터에 의해 조사된 결과에 의하면 573번 직구를 던졌고, 평균 96마일 이상의 공을 뿌렸다. 반면 그의 팀메이트 크리스 영은 평균적인 스피드인 91마일을 던졌다. 다른 팀메이트인 저스틴 허마노는 변화구 위주의 투수로 그의 직구 스피드는 평균 87마일에 불과하다.

타격이 되었을때와 그렇지 않을때를 비교하다 보면, 흥미로운 사실들을 발견하게 된다. J.J 푸츠는 타격이 되었을 경우에 평균 이하였고(직구를 던졌을때 6개의 홈런을 허용), 타격이 되지 않았을때는 아주 훌륭했다. 아마도 은연중에 푸츠는 이 사실을 알고 있었고, 그래서 타격으로 이루어진 투구를 최대한 줄일 수 있었다. (614개의 직구 중에 90개만 타격이 이루어짐). 브렌던 웹은 정 반대이다. 그는 타격이 되었을때 보다 효과적이었고, 실제로 이 샘플에서 투구가 타격으로 이루어진 비율이 가장 높은 선수 중 한명이다.


Sliders

투수들은 보통 아주 많은 직구를 던지고, 그래서 최고의 직구를 찾는데 기준을 최소 500개로 삼았다. 만일 슬라이더에도 같은 기준을 적용한다면, 겨우 10명의 투수 정도만을 찾을 수 있을 것이다. 그러면 흥미롭지도 못할테고. 대신, 나는 pitch-f/x 데이터를 기준으로 슬라이더를 많이 던진 20명의 투수들을 선별했다. 결과는 다음과 같았고, 100투구당 득점으로 순위를 매겼다.


샘플 사이즈 문제는 아주 중요하게 되었다. 많은 선수들이 타격이 이루어진 투구가 100개가 되지 못했고, 타격이 이루어진 경우의 runs100의 수치들이 상당히 들쑥날쑥하다는 것을 알 수 있다. 우리가 보다 많은 데이터를 얻을 경우 과연 션 마르컴이 100투구당 평균 -9.4점을 기록할지에 의구심이 든다. 하지만, 어쨌든 그를 신뢰하도록 하자. 2007년에 그렇게 한 것은 사실이니까.

물론 스몰츠는 슬라이더로 유명한 선수이고, 이 리스트에서도 상위권에 있다. 타격이 이루어졌을 경우의 그의 기록(100투구당 +6.7점)이 기록상의 오차라고 여겨지기도 하며, 이것이 아니라면 그의 순위는 더 높아졌을 것이다.

Change-ups


로키스의 제프 프란시스가 1위이다. 블랜튼과 바즈케즈, 헨드릭슨 그리고 글래빈이 5위안에 들었다. 흥미로운 사실로, 체인지업으로 유명한 제이미 모이어의 2007년 체인지업이 형편없이 구사되었다는 것이다. 모이어의 체인지업을 상대타자들이 타격을 했을때, 그의 살인적인 수준이었다. 100투구당 평균을 기준으로 했을때 무려 17.6점이나 나쁘다. 타격이 이루어졌을때 그저 운이 나빴을 가능성이 있다. 적어도 나는, 불운 때문이었다고 믿고 싶다.

Curveballs


웁스, 왠디가 1위라니? 사실, 나는 로드리게즈가 훌륭한 커브볼의 소유자라고 들은 바가 있다. 타격이 이루어졌을 경우 믿을 수 없는 -14.7점(100투구당)을 기록한 왠디의 기록을 제쳐둔다면, 남은 탑3는 버넷, 베켓 그리고 피비이다. 이 경우가 아주 그럴듯하게 들린다.

마무리를 지으며

실제로 고백해야 할 사실이 있는데, 내가 여기서 사용한 방법은 다소 요란하긴 하지만, 만족스럽진 못하다. 더 자세한 분석을 위해, 우리는 더 많은 데이터가 필요하다. 특정한 타입의 구질을 놓고 단지 몇백개의 투구만을 분석한다는 것 자체가 우리가 조사한 득점 가치(run value)에 많은 의구심을 동반하고 있다. 따라서, 최고의 구질에 대한 명확한 리스트라고 생각하기보다는 그저 전체적인 개괄쯤으로 그 결과를 받아들여주길 바란다.

현재로선 이 이상 어찔 할 방도가 없다. 단지 pitch-f/x 시스템이 2008시즌에는 모든 구장에 자리를 잘 잡을 것이라는 사실은 반가운 일이다.