[스크랩] 이탈리아 박사의 소치스캔들 논문 최종본 (2)

2014. 10. 2. 11:13

소치스캔들: 소치 올림픽 여자 피겨 스케이팅 편파 판정 분석 논문 최종본 (2)

이탈리아 Tiziano Virgili 박사

http://www.mediafire.com/view/zsyuye3bea5e2kb/StatisticalAnalysisBooklet.pdf

제2장

소치 결과의 분석

- 15쪽 -

피겨 스케이팅에서 선수들은 각기 시간이 다른 2개의 연기에서 그들의 능력을 보여줄 것을 요구받는다:

"쇼트 프로그램" (SP, 2분 30초) & "프리 프로그램" (FP, 시니어 여싱의 경우 4분).

쇼트 프로그램에는 (점프와 스핀, 스텝시퀀스 등) 7개의 기술요소들이 있으며,

프리 프로그램에는 12개의 기술요소들이 포함된다.

두 가지 경우 모두에서, 심판진은 기술점수(TES)와 예술점수(PCS)를 부여한다.

(TES와 PCS) 양쪽 점수가 합계 점수에서 대략 똑같은 비중을 갖게 되는 방식으로 정해진다.

게다가, 프리 프로그램 점수는 쇼트 프로그램 점수의 약 2배이다.

요약해서 말하면, 다음과 같은 식으로 총점이 대충 나눠질 수 있다:

쇼트 프로그램 TES 1/6, 쇼트 프로그램 PCS 1/6,

프리 프로그램 TES 1/3, 프리 프로그램 PCS 1/3.

소치 여자 피겨 스케이팅에 관한 토론의 대부분이 프리 프로그램 기술점수(TES)에

초점이 맞춰져 있는데, 사실 이것은 총점의 겨우 3분의 1만 차지할 뿐이다!

다음에서, 나는 간단한 표준 통계(학)적 방법들로 수행된 점수 분석을 제시할 것이다.

2.1. 기술점수

기술점수부터 시작해서, 어떤 식으로 점수들이 정해지는지 짧게 기억을 떠올려보자.

각 스케이터는 (점프, 스핀 등의) 정해진 수의 (수행)요소들을 연기해야 한다.

"테크니컬 패널"이 요소들의 정확성을 평가하고 (즉, 회전부족과 롱에지 같은 실수들을 체크),

잘 정의된 룰에 의거해, 그 요소들 각각에 대한 "출발값"을 정한다.

결국, 각 스케이터는 각각의 수행요소에 대한 "기초점"을 얻는다.

추가 점수는 "GOE"에서 나온다.

GOE는 다음과 같은 방식으로 평가된다: 9명의 저지들이 각 수행요소에 대해,

수행의 "클린 정도"와 "아름다움" 등등에 따라, -3점부터 +3점까지 점수를 준다.

그런 다음 (최고값과 최저값을 제거하는) 절삭평균이 적용된다.

이 결과는 "SOV (Scale Of Value)"를 이용해서 하나의 값으로 재차 전환된 다음

기초점에 합산된다.

한 예로, 그림 2.1은 일본 스케이터인 아사다 마오에 대한 저징 패널의 채점을 보여준다:

예상했던 대로, 수행요소들의 평가에서 다른 저지들과는

다른 변이의[편차가 큰, 혼자 튀는 점수들을 준] 저지가 1명 존재한다.

- 16쪽 -

그림 2.1: 아사다 마오 테크니컬 패널 (아사다 마오 소치 FS 프로토콜)

다음의 표는, 상위 12명의 스케이터들의 쇼트 프로그램과 프리 프로그램 기초점(BV)이다.

"기초점" 순위와 기술점수의 (쇼트+프리) 합계도 또한 기록되어 있다.

표 2.1: 소치 상위 12명의 스케이터의 기초점

- 17쪽 -

시합의 최종 순위가 우리가 기초점으로 구한 순위와 아주 다르다는 걸 볼 수 있다.

기초점은, 수행의 퀄리티가 포함되지 않은, 어디까지나 출발값일 뿐이기 때문에,

이것은 크게 놀랄 일이 아니다.

예를 들어, 기초점에 의하면, 1위 스케이터는 그레이시 골드여야 하지만,

최종 순위에서 그녀는 4위에 그쳤다. 대신, 더 놀라워 보이는 것은

기술점수 (쇼트+프리) 합계와 최종 순위가 거의 완벽하게 일치한다는 점이다.

기술점수(TES)가 총점의 약 절반을 차지한다고 한 것을 여러분께 상기시키고자 한다.

그러나 앞서의 표에서, "예술점수(PCS)"는 완전히 무의미한 것처럼 보인다.

"예술점수 (프로그램 구성점수)"는 제2장 2절(par. 2.2.)에서 논의될 것이다.

"GOE"가 기초점과 최종 TES 사이의 차이의 원인이기 때문에,

앞 페이지의 표는 "GOE"의 관련성을 보여준다.

그러나 점수의 대부분은 "기초점"에서 나오는 것이므로,

기초점에서의 편차[편이]가 최종결과에 대단히 위험한 영향을 미칠 수 있다.

주의: 공식 기초점은, 그 다음에서, 고찰될 것이기 때문에,

이 분석에서는 GOE에 관해서만 시행될 것이다.

여러 해설자들에 따르면, 소트니코바가 수행한 몇 가지 요소들이 테크니컬 패널에 의해

과한 평가를 받은 반면, 김연아가 수행한 요소들 중 일부는 과소평가되었다.

나는 이 토론에는 참가하지 않을 것이며, 테크니컬 패널이 일을 잘했다고 일단 전제한다

(NOTE: 테크니컬 패널이 판정을 바르게 했다고 전제하고 수행한 통계 분석임에도

소트니코바의 점수가 정상적인 통계학적 분포 범위를 벗어났다는 것이 이 분석의 핵심)

웹상에서 찾은 테크니컬 전문가들에 의한 분석 자료들의 링크가 부록 1에 기록되어 있다.

(소치스캔들과 관련한) 대부분의 토론들이 테크니컬 패널의 결정에 초점이 맞춰졌다는 점을

나는 다시 한 번 언급하고 싶다.

- 18쪽 -

2.1.1. 프리 프로그램

이제 GOE에 대한 분석으로 다시 돌아가서, 프리 프로그램부터 시작해보자.

(조직적인 과대평가/과소평가 같은) 편이[편향]의 가능성에 대해 조사하기 위해서는,

각 저지의 점수(GOE)를 합산해볼 수 있다.

예를 들어, 스케이터 그레이시 골드(미국, 4위)의 프리 프로그램 GOE 합계가 여기 기록되어 있다:

16, 20, 14, 15, 15, 13, 17, 14, 14.

각 저지별로 1개씩, 당연히, 9개의 숫자가 존재한다.

우리는 이 9개의 숫자들을 그림 2.2에서와 같이 하나의 히스토그램에 표시해 넣을 수 있다.

평균은 15.33이고 표준편차는 2.0이라는 것 또한 동일한 그림에 기록되어 있다.

그림 2.2: 그레이시 골드의 GOE 분포 (프리 프로그램)

이제 상위 6명의 스케이터에 대한 똑같은 분포(표)를 한 번 살펴보자

(우리는 프리 프로그램을 다시 고찰 중이다. 결과는 다음 페이지의 그림 2.3에 기록되어 있다.

언제나처럼, RMS는 점수들의 고른 분포, 즉 심판들의 평가의 통일성을 지시한다:

표준편차가 클수록 저징 패널의 통일성은 더 적어진다 (= 심판들 사이에 점수의 편차가 크다).

모든 표준편차들이 어느 정도 비슷비슷한데, 눈에 확 띄는 예외가 존재한다:

소트니코바와 (어쩌면) 리프니츠카야도.

원으로 표시한 이 2명의 표준편차는 실제로 24명의 스케이터들의 전체 표본중에서 가장 크다.

이것이 단지 통계(학)상 나올 수 있는 변이일 수 있을까?

(소치에서) 관측된 표준편차 등귀의 양을 측정하기 위해서,

똑같은 분석(방법)을 주요 국제대회들로 확대해서 "GOE" 분포의 표준편차를 확인해보자.

여기 다음의 시합들을 고찰해보았다: 2013 월드, 2014 월드, 소치 올림픽, 그리고 5개 그랑프리 대회.

사용된 표준편차는 (소치)상위 6명의 스케이터들이 (위에서 열거한 대회들 중 참가한)

모든 경우(기록)들을 계산한 것이다.

- 19쪽 -

그림 2.3: (2014 올림픽 프리 프로그램) 상위 6명의 스케이터들의 GOE 분포

이 상위 6명의 스케이터들의 주요 국제대회 표준편차 분포는 그림 2.4(다음 페이지)에 기록되어 있다.

평균과 표준편차 또한 동일한 그림에 기록되어 있다.

(이것은 "RMS (표준편차)"의 분포이므로, 이건 이것대로의 RMS를 갖는다!).

주의: 개별 스케이터들의 "RMS (표준편차)"와 구별하기 위해,

이 분포의 "RMS (표준편차)"는 (따옴표 없이) RMS로 인용할 것이다.

- 20쪽 -

그림 2.4: 개별 스케이터들의 "RMS" 분포

그림 2.4는 마지막 값의(소트니코바) 평균으로부터의 거리가 약 3RMS(표준편차의 3배)라는 것을

명확하게 보여준다. 이것이 여기 그래프에 표시되어 있다:

그림 2.5: 소트니코바의 값이 평균으로부터 약 3RMS만큼 멀리 떨어져 있다.

수치적으로, (M + 3RMS는) 소트니코바의 값 5.287와 굉장히 가깝다.

(= 분포도의 경계선에 거의 걸려있는 상태) 통계학적인 관점에서,

이것이 "정상적인" 값일 가능성은 대단히 낮다고 우리는 결론내릴 수 있다⑸.

⑸ 정상적인 분포[정규분포]에서, 이렇게 나올 확률은 대략 1000분의 1이다.

- 21쪽 -

이런 큰값은 해당 스케이터의 스킬에 달려있지 않다는 점을 강조하는 것이 중요하다!

이것은, 본질적으로, 심판 점수들의 통일성에 달려있다.

제한적인 경우로, 만약 심판 전원이 똑같은 점수를 준다면 (얼마나 크든 상관없이),

표준편차는 정확히 0이 될 것이다.

따라서 이런 변칙적인[비정상적인] 값은 심판들의 (점수) 불일치가 컸음을 나타낸다.

유감스럽게도, 이런 큰 표준편차가 우리로하여금 편차가 큰 값들을 제거하기 위해

제1장에서 설명한 방법을 사용할 수 없도록 막고 있다.

그러나 우리는 또 다른 방법을 사용할 수 있는데,

그것은 다음 섹션에서 설명할 것이다.

2.1.2. 새로운 통계(학)적 테스트

또 다른 방식으로 이 상황들을 알아보자. 스케이터의 각 기술요소에 대하여

(9명의 저지 전원의 점수들이 포함된) 평균 점수를 고찰해보고,

각 심판에 대하여 그 심판이 평균보다 높은 점수를 준 횟수 N을 계산해보자.

이번에도 다시, 16페이지에 기록된 아사다 마오의 테크니컬 패널 점수를 이용해서

예를 만들어보자. 먼저, 우리는 첫번째 수행요소의 (GOE 첫줄) 평균을 계산한다: 그 수는 0.44.

이 경우에, 평균보다 높은 점수를 준 저지는 4명이며, 5명은 평균 이하의 점수를 주었다.

(이것은 정상적인 상황에서 어느 정도 예상할 수 있는 범주에 속한다).

그 다음으로, 우리는 두 번째 수행요소를 고찰한다: 평균은 0이다.

이 경우에 평균보다 높은 GOE 점수를 준 저지가 3명 있으며,

3명의 저지는 평균 아래의 점수를, 3명의 저지는 평균점을 주었다.

이번에도 다시, 이것은 정상적인 상황에서 예상할 수 있는 채점이다.

모든 요소들에 대해 이 exercise를 반복해보자.

그리고 이제 1번 심판의 점수들을 확인해보고, 그가 평균 이상 또는 이하의 점수를

각각 몇 차례 주었는지 확인해보자. 우리의 예(아사다 마오의 소치 프리 채점표)에서,

1번 심판은 세 차례 평균보다 높은 점수를 주었고, 평균점을 준 것이 한 번,

평균보다 낮은 점수를 준 것은 8번이다. 따라서 1번 심판의 N=1이고 9번 심판의 N=5이다.

만약 우리가 심판 전원에 대해 이 exercise를 다 마친다면,

우리는 9개의 숫자를 얻게 되고, 이것들을 하나의 히스토그램에 표시할 수 있다.

이것은 이 개별 스케이터(아사다 마오)에 대한 분포(표)이다.

그러나 우리는 또한 다른 모든 스케이터들의 숫자 N 모두를 동일한 히스토그램 안에 표시할 수 있다.

이런 식으로, 우리는 9x24=216개의 엔트리값이 있는 커다란 히스토그램을 만들 수 있다.

프리 프로그램에는 12개의 수행요소들이 있으므로, 숫자 N은 0에서 12 사이로 한정된다.

우리가 봤듯이, 편향이[치우침이] 없는 점수들의 경우에, 각 심판은

(1명의 심판이) 때로는 평균보다 높은 점수를 주기도 하고, 때로는 평균보다 낮은 점수를 주기도 하고,

또 때로는 (가능성은 낮지만) 평균점을 주기도 한다.

(= 한 심판이 무조건 다 평균보다 낮은 점수를 주거나, 무조건 다 높은 점수를 주는 경우에

그 심판의 점수들에는 편향[치우침]이 존재한다.)

따라서 우리는 N의 분포(도)가 0-12 사이 구간의 가운데 부분 근처에서

최고점을 그릴 것으로 대개 기대한다.

("평균보다 크거나 같은"이 아니라 "평균보다 큰"이라는 조건 때문에 실제로는

6보다 약간 낮은 지점에서 그래프가 가장 높게 나와야 맞다.)

이제, 모든 스케이터들과 모든 심판들을 고찰해보고,

N의 분포(도)를 확인해보자.

- 22쪽 -

그림 2.6: 소치 스케이터 전체의 N의 분포

이 전체 분포(도)는 평균이 약 5.2이고, 표준편차는 2.4이다.

N>6과 N<3에 대하여 엔트리값들이 급격하게 감소한 것이 보인다.

그러나 무시하고 넘어갈 수 없는 엔트리값들 또한 N값이 큰 구간에 존재한다.

이 숫자는 통계학적으로 있을 수 있는 변이들과 양립가능한 수치인가?

큰 N값은 일부 저지들이 대부분의 경우에 평균보다 높은 점수를 주었음을 가리킨다는

사실을 다시 한 번 언급하고자 한다.

이것에 대해 더 정확한 무언가를 우리가 말할 수 있을까?

실제로, 통계학과 아마 (자연계의) 법칙들에서 이런 분포를 측정하는 것이 이론적으로는 가능하다.

다시 말해서, 한 심판이 평균보다 높은 점수를 줄 가능성에 대해 특정 N의 횟수를

선험적으로 계산하는 것이 가능하다는 것이다.

그러나 만약 한 심판이 항상 평균보다 높은 점수를 준다면

그가 (특정 스케이터에게) 치우쳐 있는 게 자명하다는 것을 이해하기 위해

확률 법칙의 전문가가 될 필요는 없다!

이제 1위 스케이터(아델리나 소트니코바)에 해당하는 엔트리값을 발췌해 보도록 하자.

(다음 페이지의) 그림 2.7에서 붉은색으로 표시되어 있다.

여러분도 볼 수 있는 것처럼,

총 12개의 채점 항목에 대해 8차례나 평균보다 높은 점수를 준 심판이 2명 있고,

총 12개의 채점 항목에 대해 11차례나 평균보다 높은 점수를 준 심판도 2명이나 된다!

이것은 어떤 통계학적 변이에서 보더라도 확연하게 돌출되어 있으며(튀며),

이것은 당연히 치우침[편향]이다.

소트니코바가 편향된 점수를 받은 유일한 스케이터라고 우리가 여기에서 주장하고 있는 건

아니지만, 확실히 그녀는 편차가 가장 큰[편향이 가장 심한] 점수를 받았다.

나머지 심판들은 구조상, 낮은 N값의 구간으로, 왼쪽으로 쏠려 있다는 점을 주목하시오.

원칙적으로, 정반대 방향에서 이 결과를 해석하는 것 또한 가능하다:

일군의 심판들이 이 스케이터에게 언더스코어를 주는 바람에,

나머지 심판들이 구조상, 큰 N값의 구간으로, 오른쪽으로 밀리게 된 것으로 말이다

(= 다른 심판들이 점수를 너무 짜게 주는 바람에 평균점이 너무 낮아져서,

퍼준 게 아닌데도, 퍼준 것처럼 N값이 크게 나타난 것이라는 정반대의 해석도 가능하다).

- 23쪽 -

그림 2.7: 소티느코바의 N값의 분포 (붉은색 표시)

비교를 위해, 2위 스케이터 김연아의 N값의 분포를 그림 2.8에 초록색으로 기록했다.

이 경우에, 표준편차 또한 (아델리나 소트니코바의 4보다) 훨씬 낮은 2.6으로,

전체 분포의 표준편차인 2.4와 가깝다.

이 방법에 대한 더 자세한 내용은 부록 2에서 찾을 수 있다.

그림 2.8: 김연아의 N값의 분포 (초록색)

- 24쪽 -

2.1.3. 쇼트 프로그램

이제 우리는 쇼트 프로그램에 대해서도 앞서의 exercise를 반복해 실행할 수 있으며,

상위 6명의 스케이터들의 GOE 분포부터 시작해보자.

그림 2.9: 상위 6명의 스케이터들의 GOE 분포

이 경우에는, 표준편찬뿐만 아니라 분포(도)들도 더 균질하게 보인다.

(쇼트 프로그램에는) 7개의 수행요소들만 있기 때문에, 프리 프로그램과 비교해 평균값들이 더 작다.

표준편차에 대해서도 마찬가지다.

(다음 페이지의) 그림 2.10에 N값의 분포가 기록되어 있다.

이 경우, 수행요소의 개수가 7개이기 때문에, N값의 범위는 0부터 7 사이 구간이다.

- 25쪽 -

그림 2.10: 스케이터 전원의 N값의 분포 (쇼트 프로그램)

그러나 이 경우에, 더 적은 수행요소의 개수가

점수들에서의 체계적 편향을 지적하는 것을 더 어렵게 만든다.

총 7개의 채점항목 전부에 대해 평균보다 높은 점수를 준 심판이 3명이 있지만,

그들 (모두가) 동일한 스케이터에 연관되어 있는 것은 아니다.

이것으로부터, 상황을 더 잘 분명히 밝히는 것이 비록 가능하진 않지만,

적은 양의 치우침[편향]이 쇼트 프로그램에서도 또한 존재한다고 우리는 결론내릴 수 있다.

2.2. 프로그램 구성점수 (PCS)

"프로그램 구성점수 (PCS)"는 연기에 대한 "예술적인 인상[느낌]"을 가리키며,

안무와 해석 기타 등등을 포함해 여러 가지 면을 고려함으로써 평가된다.

각 심판은 각각의 항목에 0점부터 10점까지의 점수를 준다 (10점은 일종의 "완벽"에 해당한다).

그런 다음 평소와 마찬가지로 절삭평균을 실시해 5개의 항목 전체의 점수를 합산한다.

최종 (PCS) 점수는 쇼트 프로그램은 0.8, 프리 프로그램은 1.6의 인수(팩터)를 적용해 얻어진다.

기술점수와 예술점수의 밸런스를 맞추기 위해 이 인수(팩터)들이 필요하다.

처음 볼 땐, 이 점수가 가장 주관적인 것처럼 보일지도 모른다.

사실, 이 요소들의 평가가 앞서 논의한 "GOE"보다 더 주관적인 것은 아니다.

이 문제에 대해서는 다음 장에서 다시 얘기하겠다.

여기에서는, 한 가지 중요한 차이점을 지적하고 싶다.

뜻밖의 에러나 실수 등등 때문에 기술적인 수행들은 시합마다 다를 수 있는 반면,

구성점수(PCS)는 원칙적으로 훨씬 더 안정되어 있다 (= 변동이 적다).

- 26쪽 -

예를 들어, 한 뛰어난 피아니스트가 우연히 실수를 하나 할 수 있지만,

의심이 여지 없이, (그의) 해석은 여전히 뛰어남을 유지할 것이다.

게다가 안무 같은 요소들은 스케이터가 범할 수 있는 실수들에 의해 크게 달라지지 않는다.

각 심판의 점수를 합산함으로써, 기술요소들에 대해서도 같은 식으로 계속 진행해보자.

16페이지를 (아사다 마오의 프리 스케이팅 점수) 참조하여, 프리 프로그램부터 시작해

PCS를 살펴보면, 인수(팩터)가 곱해지기 전인 다음의 숫자들이 나온다:

42.75, 44.25, 43.0, 44.25, 47.0, 41.0, 41.25, 44.25, 44.75.

평균은 43.61이고, 표준편차는 1.75이다. 최종 결과를 얻기 위해 팩터 1.6을 적용하면

평균은 69.78이고 표준편차는 2.8이다.

이번에도 다시, 이 9개의 숫자들을 하나의 히스토그램 안으로 삽입시킬 수 있으며,

모든 스케이터들에 대해 이 exercixe 시행을 반복할 수 있다.

그림 2.11: 상위 6명의 스케이터들의 PCS 분포 (프리 스케이팅)

- 27쪽 -

상위 6명의 스케이터들의 프리 프로그램 (PCS) 분포가 그림 2.11에 제시되어 있다.

여기에서는 상황이 기술점수(TES)보다 훨씬 더 기이하게 보인다.

그러나 표준편차는 더 조화로워 보인다, 비록 심판들로부터 큰 편차들이 존재하고

붉은색 화살표로 표시한 "비정상적인 봉우리(최고점)이 보이지만 말이다.

이 분포(도)의 형태는 정말로 정말로 기이하게 보인다.

그러나 좀 더 양적인 분석을 수행하기에는 도수가 (9개로) 너무 낮다.

또한, 적은 수의 요소들(5개) 때문에, 2.1.2에서 설명한 절차도 도움이 되지 않을 것이다.

그러므로 우리는 또 다른 분석 전략을 세워야 한다.

더 나은 이해를 얻기 위해, 우리는 프로그램 구성점수(PCS)의 다음의 중요한 면을 이용할 수 있다:

대회에 따라 점수의 변동이 크지 않고 거의 변치 않아야 한다는 점

(앞서 말했듯이, 훌륭한 피아니스트가 우연히 기술적인 실수를 한 번 할 수는 있어도,

그럼에도 그는 여전히 훌륭한 피아니스트로 인식될 것이다).

따라서 각 스케이터에 대하여 가장 최근의 국제대회들에 대한 평균점수와 올림픽 PCS 점수들을

비교해보도록 해보자. 이 목적을 위해, 나는 2013년 세계선수권대회와 그랑프리 등등

(소치 올림픽 전) 1년 이내의 모든 대회들을 검토했다.

예를 들어, 나는 아사다 마오에 대해 쇼트 프로그램 평균 PCS가 33.66점으로 계산했다.

소치에서의 PCS는 33.88점이었으므로, 편차는 0.22점이다.

(각 스케이터 별로 하나씩 구한) 이 편차들을 이용해 히스토그램을 만들 수 있다:

쇼트 프로그램에 관해, 이것을 그림 2.12에서 볼 수 있다.

이 분포의 평균은 1.6으로, 다른 대회들의 평균과 소치 PCS 사이에 평균 +1.6점의 점수 이동이

존재한다는 뜻이다, 즉 각 스케이터가 "평소"보다 1.6점 더 받았다는 뜻이 된다.

그림 2.12: 2014 올림픽 PCS와 다른 국제대회들의 평균 PCS 점수 사이의 차이 (쇼트 프로그램)

- 28쪽 -

같은 도표가 그림 2.13에 다시 한 번 기록되어 있으며,

이 분포의 표준편차는 1.65으로 붉은색 가로선으로 표시되어 있다.

언제나처럼, 이 숫자는 전체적인 분산의 폭을 지시해주는 역할을 한다.

일부 스케이터들의 값들 또한 같은 그림에 기록되어 있으며, 붉은색 화살표로 표시되어 있다.

차이는 대부분은 크지 않다 (평균 1.6점). 그러나 소수의 스케이터들은 엄청난 차이(PCS 상승)를 보인다.

소트니코바의 경우, 이 차는 5.8로, 평균에서 매우 멀다.

RMS 유닛에서, 이 값은 평균으로부터 2RMS(RMS의 2배에 해당하는 거리)보다 더 멀리 떨어져 있다.

그림 2.13: 일부 스케이터들의 값의 평균으로부터 떨어진 거리

다시 말해서, 이 값은 이 분포(도)와 양립할 수 없으며, 통계학상 있을 수 있는 변이로 고려될 수 없다.

이 상황은 프리 프로그램에서도 비슷하다 (그림 2.14에서 그 분포(도)가 기록되어 있다).

이 경우에, 평균은 약 4점으로, 즉 스케이터들이 이전 대회보다 평균 4점을 더 받았다는 뜻이 된다.

이것은 제1장에서 설명한 "포괄적인 편이"에 해당한다.

다음 장에서 이 포괄적인 편이에 대해 다시 다루겠다.

- 29쪽 -

만약 우리가 RMS 유닛을 이용해서 평균으로부터의 거리를 비교한다면,

(이번에도 또 이전 PCS 평균과의 차에서 최대치를 기록한) 소트니코바는

평균으로부터 3RMS(RMS의 약 3배 떨어진 곳)에 위치한다.

그림 2.14: 2014 올림픽 PCS와 다른 국제대회들의 평균 PCS 점수 사이의 차이 (프리 프로그램)

요약하면, PCS의 분석은 쇼트 PCS 1.6점과 프리 PCS 4점의 평균 상승 이동을 보여준다.

대부분의 스케이터들이 1RMS(평균으로부터의 거리가 RMS보다 적은 값)의 범위 이내에서

종전 PCS 평균과의 차를 보여준다. 따라서 대부분의 스케이터들의 경우,

다른 시합들의 PCS 평균과 소치 올림픽 점수 차이는 전체적으로 상승 이동한

"정상적인" 통계학상의 변이로 양립이 가능하다 (모순이 없다).

이런 점수 이동은 확실히 특정한 심판진 구성에 따라 있을 수 있는 일이며,

"정상적"인 것으로 간주될 수 있다.

그러나 소수의 스케이터들은 엄청난 점수차(PCS 상승)을 보여주고 있으며,

특히 소트니코바는 쇼트와 프리 프로그램 양쪽 모두에서 2RMS보다 더 큰 차이를 보인다.

통계학적인 관점에서, 이것이 단순한 (통계학상 있을 수 있는) 변이일 가능성은 거의 제로이다.

"기적들"이 존재한다고 믿지 않는 한, 그러하다.

우리는 PCS에서도 강한 편이[편향]가 존재했다고 결론내릴 수밖에 없다.

이것은 "평범한" 피아니스트가 갑자기 "천재"가 되는 경우와 마찬가지일 수 있다.

To Be Continued...

http://www.mediafire.com/view/zsyuye3bea5e2kb/StatisticalAnalysisBooklet.pdf

http://www.sochiscandal.com/

@lucaontheice

출처 : Viva la Reina~!

글쓴이 : 원더키디 원글보기

메모 :

'Aart♡Sport' 카테고리의 다른 글

[스크랩] 이탈리아 박사의 소치스캔들 논문 최종본 (4) (0)	2014.10.02
[스크랩] 이탈리아 박사의 소치스캔들 논문 최종본 (3) (0)	2014.10.02
[스크랩] 이탈리아 박사의 소치스캔들 논문 최종본 (1) (0)	2014.10.02
한국피겨사상 최초 전 그랑프리대회 출전!!!!! (0)	2014.09.11
[펌] 연아 선수 패턴 잠금화면 (0)	2014.08.22

별에서오다의 블로그

[스크랩] 이탈리아 박사의 소치스캔들 논문 최종본 (2)

'Aart♡Sport' 카테고리의 다른 글

+ Recent posts

티스토리툴바