--> I'm Lucky 최근글 <--

'오류'에 해당되는 글 4건




  1. 2016.03.14 알파고 이세돌 승리 원인, 패배 원인 resign _바둑 대형 바꿔치기, 몬테카를로 기법 확률적 한계
  2. 2010.05.12 삼성반도체 백혈병, 근로복지공단 통계 오류 해명하라 13
  3. 2010.05.05 정두언 전교조 가입률, 수능성적 공개 자료, 논리 통계 오류 8
  4. 2009.06.26 나경원 의원의 자료해석 능력 12

 

알파고 vs. 이세돌 간의 세기의 바둑 4국에서 이세돌이 극적 승리를 거두었다. (2016년 3월 13일)

 

이세돌이 승리하고, 알파고(alphago)가 패배한 이유는 무엇일까?

 

알파고에게 오류가 있었던 것일까, 아니면 이세돌이 너무나 잘 두었던 것일까?

 

결과적으로 이세돌이 잘 두었기 때문이지만, 이세돌도 의도하지 않았던 인공지능(AI)의 한계, 특히 알파고의 한계가 드러났기 때문이다.

 

그 원인을 분석해 보자.

 

 

 

<알파고, 슈퍼컴은 초반부터 두는 것이 유리하다.>

 

 

1. 알파고는 첫 수부터 바둑 집을 계산하고 들어간다.

 

알파고는 바둑을 두는 첫 수부터 집 계산을 하고 들어간다. 매 수마다 빠른 계산능력을 활용하여, 집 계산을 철저하게 한다. 

즉, 슈퍼컴은 집을 정확하게 계산하고 착수를 하기 때문에, 첫 수부터 슈퍼컴과 대결하게 되면, 슈퍼컴을 쉽게 이기기는 힘들다.

슈퍼컴 자신이 계산한 바대로, 슈퍼컴 자신이 자신의 판세를 이끌어가기 때문이다.

 

 

 

2. 만일 슈퍼컴이 최후의 수부터 둔다면, 슈퍼컴이라고 하더라도 판세를 뒤집을 순 없다.

 

만일, 이미 바둑을 거의 다 둔 상태에서, 슈퍼컴에게 마지막 한 수만을 남겨두고 이를 두게 한다면, 슈퍼컴이더라도 바둑의 판세를 뒤집을 수는 없다.

이미 두어진 바둑판이 바뀔 수 없는 주어진 전제 조건으로 작용하기 때문이다.

 

 

3. 만일 슈퍼컴이 최후의 수부터 -1번째, -2번째, -3번째, ..., -n번째, 이런 식으로 최초의 수부터 둔다면, 슈퍼컴이 이길 가능성은 계속 올라간다.

 

하지만, 슈퍼컴이 최후의 한 수(X번째)로부터 점점 시점을 당겨서, X-1번째, X-2번째, X-3번째, ..., X-n번째, 이런 식으로 해서, 최초의 수부터 두게 된다면, 슈퍼컴이 이길 가능성은 계속 올라가게 된다.

 

왜냐하면, 바둑판에 이미 두어진 돌이 점점 줄어들고, 슈퍼컴이 시뮬레이션하여 계산하여, 판세를 슈퍼컴이 계산한 바대로 이끌어갈 수 있는 가능성은 계속 올라가기 때문이다.

 

 

 

4. 바뀔 수 없는 주어진 전제 조건이 확대될 수록, 슈퍼컴이라도 판세, 승패를 뒤집을 수는 없다.

 

즉, 바둑판에서 이미 두어진 돌이 많은 상황부터 슈퍼컴이 중간에 개입할 수록, 슈퍼컴이라도 판세를 뒤집을 가능성은 점점 줄어든다는 것이다.

 

 

<중간에, 슈퍼컴 자신이 계산해 왔던 상황이, 예상치 않게 갑자기 바뀌면 어떻게 될까?>

- 슈퍼컴 알파고의 한계, 이세돌 승리원인, '대형 바꿔치기'

 

만일 초반부터 알파고, 슈퍼컴이 계산한 바대로 잘 두고 있었는데, 예상치 못하게 중간에 판세가 바뀌면 어떻게 될까?

 

엄청난 슈퍼컴인데, 예상하지 못한 상황이 발생할 수 있을까?

 

적어도 이세돌 vs. 알파고 와의 세기의 대국 4국에서는 이런 상황이 발생했다고 할 수 있다.

 

왜 발생했는지 생각해 보자.

 

 

1. 이세돌, 78수 이전에 이미, 우중앙, 우상변에서 '대형 바꿔치기' 시도해서 통했다

 

슈퍼컴은 첫 수부터 매 수마다 집 계산을 해서 착수를 한다고 했다.

 

이세돌이 78수에서 묘수를 둔 상황 이전에 이미 슈퍼컴에게 중대한 조건 변화가 발생했다는 것이다.

 

그 원인은 이세돌이 우중앙,우상변에서 시도한 대형 집바꾸기, 즉, '대형 바꿔치기'에 있다.

 

슈퍼컴은 이미 예상되는 집을 계산하고, 세력을 형성하고 있었는데, 이세돌이 대형으로 예상되는 집을 바꿔치기 하니까, 알파고로서도 갑자기 예상되는 집 계산을 다시 하게 된 것이다.

 

즉, 슈퍼컴 알파고가 첫 수부터 초중반까지 이어오던 착수의 흐름이 크게 단절되 버린 것이다.

 

물론, '대형 바꿔치기' 이후에도, 알파고는 매 수마다 계산해서 또 착수를 하면 된다. 하지만, 이세돌이 '대형 바꿔치기'를 시도한 이후로는, 첫 수부터 바꿔치기 이전까지 알파고가 놓았던 수순이 '완벽한 것'이 되지는 못한 것이다.

 

 

2. 몬테카를로 통계 기법의 한계

 

몬테카를로 기법은 통계적으로 확률적 기법을 동원하여, 확률적으로 가장 가능성 높은 수를 찾아 나서는 것이다.

 

이세돌이 '대형 바꿔치기'를 시도하기 직전까지, 알파고는 확률적으로 가장 가능성 높은 수를 찾아서 착수를 하였으나, 이세돌의 '대형 바꿔치기' 이후로는, 그 직전까지의 수가 '확률적으로 가장 가능성 높은 수'가 되지 못한 것이다.

 

즉, 주어진 전제조건이 '대형 바꿔치기'로 갑자기 초중반 대국이후로 바껴버린 것이다.

마치 첫 수부터 착수를 하던 슈퍼컴이 그 흐름이 단절되고, 초중반부터 이미 돌이 두어진 상태에서 중반부터 대국을 시작하게 된 것이나 같다.

 

자신이 지금껏 계산해 왔던 집계산이 급작스럽게 변경되는 이런 상황은 적어도 알파고, 슈퍼컴이 예상치 못했던 상황이라고 할 수 있고, 그게 아니어도, 적어도 아주 가능성이 희박한 극소한 확률의 수로 본 것임에 분명하다.

 

즉, 이세돌이 '대형 바꿔치기'를 먼저 시도했기 때문에, 대국 흐름에서 틈이 발생한 것이다.

 

이 대국 흐름의 틈에서, 이세돌이 78수라는 묘수를 발견하여 실행에 옮긴 것이라 볼 수 있다.

 

 

3. 급작스런 상황변화, 우발적 상황변화가 이미 주어진 전제 조건을 변화시킨다

 

슈퍼컴 알파고는 확률적 기법에 따라, 가장 승산이 높은 수를 따라 매번 착수를 진행한다.

 

알파고가 착수한 모든 수는 그 수를 놓을 때까지는 가장 승산이 높은 수이고, 따라서 다음 수를 놓았을 때도 높은 승률을 보장하는 수이다.

 

이세돌이 중간에 '대형 바꿔치기'를 시도하기 이전까지는 그게 맞았다.

 

하지만, 이세돌이 중간에 '대형 바꿔치기'를 시도하여, 슈퍼컴 알파고가 계산해 온 판세 흐름이 일거에 뒤바뀐 것이다.

 

즉, 아주 가능성을 희박하게 본 급작스러운 상황변화, 우발적 상황변화가 이미 형성돼 있던 판세 계산 흐름을 일거에 뒤바꿔 놓은 것이다.

 

이는 마치 중간부터 슈퍼컴이 대국을 시작하게 된 것과 같다.

 

 

4. 중간부터 슈퍼컴이 시작한다고 하더라도, 슈퍼컴이 이길 확률은 여전히 높지만, 틈이 존재한다.

 

이 틈을 이세돌이 78수 묘수를 통해 찾아낸 것이다.

 

즉, 이번 대국에서 이세돌의 승리원인은 바둑에서 큰 집을 서로 맞바꾸는 '대형 바꿔치기'에 있었다고 볼 수 있다.

 

그것도 대국 초반이나, 대국 종반이 아닌, 대국 초중반에 시도됐기 때문에, 이세돌로서도 승리의 가능성을 보장받았다고 볼 수 있다.

 

 

<알파고 슈퍼컴, 몬테카를로 기법, 통계적 확률적 기법 한계>

 

이번 대국은 알파고, 몬테카를로 확률 기법의 한계를 보여준다. (Monte Carlo method)

 

알파고가 이번에 진 이유는 이세돌(Lee Sedol)이 시도한, 대국 초중반의 '대형 바꿔치기' 때문이다.

 

중간에 백집, 흑집 예상이 갑자기 바뀌니까, 초반부터 중반까지 해오던 집계산을 알파고 슈퍼컴이 다시 하게 된 것이다.

즉, 주어진 전제가 갑자기 뒤바껴버린 것이다.

 

이는 몬테카를로 통계기법, 확률적 기번의 한계이기도 하다.

 

인공지능이 급작스런 돌발상황, 예상하지 못한 우발상황, 가능성 낮다고 판단한 희소상황에서는 완벽히 대응할 수 없다는 한계점을 시사한다.

 

알파고는 처음 1수부터 이미 집을 예상해서 계산하면서 착수에 들어간다. 그런데 알파고가 마지막 종반전의 최후 한 수만을 두게 한다면, 슈퍼컴도 주어진 판세를 뒤집을 수는 없다.

 

이런 식으로 본다면, 슈퍼컴 알파고는 초반부터 착수를 진행하는 게 유리하다. 하지만, 슈퍼컴이 중반부터 돌을 두게 된다면, 자신이 스스로 판세를 형성할 가능성은 점점 떨어진다. 이미 바둑판에 돌이 상당히 놓여져 있기 때문이다. 전제조건, 불변상황이 그만큼 많이 생성돼 있기 때문이다.

 

만일 슈퍼컴 자신이 전제상황, 혹은 가능성이 아주 떨어지는 불변상황이라고 본 상황이 갑자기 뒤바뀌게 되면 어떻게 될까?

 

이세돌은 초중반에 '대형바꿔치기'를 통해, 기존에 슈퍼컴 알파고가 형성한 판세 흐름을 일거에 바꿔놓았다.

 

물론, 이후에도 슈퍼컴 알파고는 여전히 이길 수 있었으나, 마치 중간부터 돌을 두기 시작한 것처럼, 기존에 자신이 두었던 집들은 완벽하지 않은 것이 돼 버린 것이다.

 

슈퍼컴 알파고는 이 때부터 집계산을 다시해야 했다. 이 때부터 알파고는 새로운 판세에서 대국을 두게 된 것이다.

물론 이후에도 알파고는 이길 수 있으나 완벽하게 이길 수는 없게 된 것이다. 그 틈을 이세돌이 찾은 것이다.

 

이는 몬테카를로 통계적 확률적 기법의 한계, 인공지능의 한계를 보여준다.

 

갑자기 주어진 전제조건이 뒤바껴 버리거나,

확률적으로 아주 극소하다고 판단했던 상황이 발생하거나,

혹은 우발상황이 발생하면,

 

 

인공지능(AI)은 제대로 작동하지 않을 수 있다.

 

예를 들어, 지구에 운석이 떨어지면, 인공지능 슈퍼컴은 운석에 맞아서 제대로 작동하지 않을 것이다.

예를 들어, 도로를 자동주행하도록 돼있는 슈퍼컴인데, 도로자체가 지진을 맞아서 없어지면, 슈퍼컴은 제대로 작동하지 않을 것이다

 

즉, 바둑판이기는 하지만, 전제가 갑자기 뒤바뀌는 상황, 예상할 수 없었던 상황에서 인공지능은 여전히 한계를 지닌다는 것을 반증한다.

특히 몬테카를로 기법이더라도 확률적으로 의존하기 때문에, 희박한 상황은 여전히 발생할 수 있다는 것을 의미한다.

 

 


맞춤검색

,

삼성전자 반도체 공장에서 일하던 젊은 남, 녀 직원들이 계속 '백혈병'에 걸리고 있다고 한다.

박지연, 황유미 씨와 같은 젊은 여성들을 비롯하여 이미 수많은 사망자가 발생하고 있다. 

삼성반도체 백혈병을 비롯한 각종 암 발생과 관련해서는 추후에 다시 논해보고자 한다.

그에 앞서 이 글에서는 근로복지공단의 명백하게 잘못된 통계 처리에 대해서 먼저 짚어보고자 한다.

필자는 근로복지공단의 통계 처리를 보면서, 과연 이 사람들이 '통계학'의 '기초 소양'은 지니고 있는지,
하다 못해 고등학교 수학 시간에 '통계와 확률'은 공부하기는 했는지 심히 의심을 가질 수 밖에 없었다.


근로복지공단의 통계 처리는 아주 전적으로 잘못된 것이다. 통계처리 오류다.

근로복지공단 담당자는 이와 같이 통계 처리한 것에 대해서 이론적인 근거를 밝혀야 한다.

물론 밝힐 수 없을 것이다. 잘못되었기 때문이다.

그러므로 근로복지공단은 당장 자신들의 통계 오류를 시정하여 다시 발표해야 한다.


한겨레신문 보도에 따르면, (관련보도, 원문보기)

근로복지공단"삼성전자 반도체 공장에서 일어난 백혈병은 산업 재해로 볼 수 없다"고 결정했다.

그 이유는 산업안전보건연구원의 역할조사 결과에 따른 것인데, 동 연구원은

"(A) 2008년 12월 삼성반도체 공장 조사 결과 백혈병을 유발할만한 증거를 찾을 수 없었다.

(B) 2007년까지 지난 10년간 전체 반도체 산업 종사자 22만 9683명을 대상으로 조사한 결과 여성의 경우 암 발병 비율이 1.31배 높을 뿐이어서 통계적 의미가 없고 남성은 오히려 일반인보다 낮은 수준을 보이고 있다."
고 밝혔다.

이러한 이유로 근로복지공단은 산업재해 신청을 불인정 했다고 한다.

여기서 통계적으로 문제가 되는 부분은 (B) 문장이다. 



이 문장의 결론은 명백하게 잘못된 통계 처리의 오류다.

위의 그림을 참고해서 살펴보자. [백혈병(을 비롯한 각종 암)의 발생빈도] 

근로복지공단의 논리 전개에 따르면,

반도체 산업 종사자의 백혈병 발생 빈도 << 일반인의 백혈병 발생 빈도,

즉,"'반도체 산업 종사자의 백혈병 발생빈도'가 '일반인의 백혈병 발생 빈도'보다 작기 때문에, 삼성전자 반도체 공장에서 백혈병이 특별히 더 발생한다고 볼 수 없다"는 희안한 논리를 펼치고 있다.

먼저 이 논리의 문제점, 오류부터 지적한다.



위의 그림처럼 동일한 표본 크기에서 각각 표본을 추출해보자. (샘플링, Sampling)

일반집단 (Sample1), 반도체 종사자 집단(Sample3), 삼성반도체 특정라인 집단 (Sample2)

근로복지공단은 'Sample 1'과 'Sample 3' 만을 비교하는 희안한 오류를 범했다. 

그런데, 근로복지공단에 산재 신청한 집단은 'Sample 2' 집단이다. 

결국 근로복지공단은 암발생 당사자들인 'Sample 2' 집단은 아예 여집합처럼 표본 집단에서 제외시켜 버린 것이다.
(Sample 2 - 삼성전자 반도체 기흥공장 특정 라인 종사자)

이는 명백한 오류다.


그렇다면 정확한 비교는 어떤 것인가?

근로복지공단은 'Sample 2 - 'Sample 1를 비교하던가, 'Sample 2' - 'Sample 3'을 비교해야 한다.
("삼성반도체 특정라인 - 전체 반도체산업 종사자", or "삼성반도체 특정라인 - 일반인 집단")

어떤 식이든 'Sample 2', "삼성전자 반도체 특정 라인 종사자 집단"이 비교집단에 포함되어 있어야 한다.

따라서,
1) "반도체 산업 전체 종사자"와 "삼성전자 반도체 라인"을 비교하던가,
2) "일반 집단"과 "삼성전자 반도체 라인"을 비교하는 것이 맞다.

더 정확하게 본다면, "삼성전자 전체반도체 라인"과 "삼성전자 반도체 특정 라인(클린룸)"과 비교하는 것이 맞다. 

그런데 근로복지공단은 "반도체 산업 전체 종사자" 집단과 "일반인" 집단을 비교하는 통계 오류를 범했다.
아예 비교할 필요도 없는 엄한 "제 3자 집단들"만을 비교하고 있다.

이는 명백한 오류다. 따라서 논리(Logic) 전개 과정이 잘못되었으므로, 그 결론도 오류다.



위의 그림에서 쉽게 살펴볼 수 있듯이,

삼성전자 반도체 공장의 특정라인에서는 백혈병을 비롯한 각종 암 발병률(%)은,

>> 삼성전자 반도체 공장 전체 집단의 발병률(%)보다 높고,
>> 반도체산업 전체 종사자 집단의 발병률(%)보다 높고,
>> 일반인 집단 발병률(%)보다 높다.


따라서, 삼성전자 반도체 기흥공장 특정 라인(1,2,3세대 라인)이 백혈병을 비롯한 각종 암발생의 원인이 되었다는 것은 적어도 통계적으로는 분명하다.

그럼에도 불구하고, 근로복지공단은 정말로 희안한 어처구니 없는 통계 처리로 사건의 진실을 왜곡했다.

통계의 기본도 갖추지 못하고 해당 업무에 종사한 근로복지공단 담당자는 즉각 해명해야 하고, 위와 같은 통계 처리 오류를 시정해야 한다.


여담으로 필자는 여러 글에서 '논리'(Logic'을 강조하고 있다.
공부를 열심히 하여 진전해 나가면 '문리'(文理)가 터진다는 말이 있다. 굳이 공부를 열심히 안해도, 이 세상에는 '문리', 즉 'Logic'이라는게 있다. '수학'이나 '이학', '공학'의 세계에만 '로직'이 있는게 아니다.

사회현상에도 당연히 있다. 잘못된 '논리', 엄한 '논리', 결국 '논리적 오류'는 위와 같이 엄한 결론을 만들어 낸다.
거기에 행동까지 더해지면 걷잡을 수 없는 일들이 벌어질 수도 있다.

그래서 항상 강조하는 것이다. '논리적 사고'를 키우고 '논리적 전개'를 통해 '합리적인 추론'에 도달해야 한다.


위의 근로복지공단 사례도 다르지 않다. '잘못된 논리'는 타인(他人)에게 '상처'를 준다는 것이다.

근로복지공단은 기초적인 통계 처리에 오류를 범하여, 백혈병을 비롯한 중병을 얻고 생명까지 잃은 당사자들에게 엄청난 고통을 안겨주고 있다는 사실을 즉각 인식해야만 한다.

근로복지공단은 위와 같이 잘못된 통계 처리를 하게 된 배경을 밝히고, 즉각 사과하고, 제대로된 통계 보고를 해야 한다. 




맞춤검색

,

정두언 의원이 '전교조 가입률이 높을수록 수능성적이 저하된다'는 분석 자료를 5월 5일 어린이날에 내놓았습니다. 

그런데 이 자료는 기초적인 통계 분석 방법론에서 오류를 범하고 있기 때문에, 결국 잘못된 자료라고 볼 수 있습니다. 

정두언 의원이 이런 논리 통계적 오류를 반복하지 않기 위해서는, 기초적인 '통계학' 교재를 필히 보고 통계 방법론을 학습하기를 이 자리를 빌어 권장합니다.

모르는데도 불구하고 지위를 악용하여 '말'만 내뱉는 '혹세무민'(惑世誣民)을 하면 안되기 때문입니다. 

비교 통계에서 가장 기본은 다른 모든 변수(factor)들을 동일한 조건에서 유지하는 것입니다.
즉, 비교 변수 이외에 다른 모든 변수는 고정되어 있거나 동일해야 합니다.




물론 사회현상에서는 그런 실험, 데이터 통제가 곤란하기 때문에, 최대한 비슷한 경우를 선정해야 합니다.

그런데, 정두언 의원이 발표한 자료를 보면, 이런 기초적인 조건이 지켜지고 있는지 의심스럽습니다.


[비교 대상 변수 이외의, 다른 변수 조건은 동일하거나 유사해야 한다]

'전교조 가입률과 수능성적'의 '상관 관계'를 살펴보고 싶으면, 다른 조건은 동일하게 유지해야 합니다.

1. 다른 모든 변수는 유사하게 동일해야 한다.

2. 일반고 - 특수목적고 구별되어야 한다.

3. 사립고 - 공립고 구별되어야 한다.

4. 인문계 - 실업계(기능고) 구별되어야 한다.

예컨대, 위와 같은 조건들이 지켜지고 있는지 의심스럽습니다.

정두언 의원이 자신의 바람데로, '전교조 40% 이상' 학교와 '전교조 5% 미만' 학교를 비교하고 싶으면, 다른 모든 조건은 동일하게 유지되어야 합니다.

예컨대 사립고 A고와 공립고 B고를 비교하는 것은 설득력이 없습니다. 같은 사립고에 속하는 A1, A2 고등학교 집단을 비교해야 합니다. 다른 기준도 마찬가지입니다.


[통계 방법론, 기초데이터가 공개되어야 한다]


정두언 의원이 발표한 자료를 보면, 어떤 자료를 가지고 어떤 방법론에 따라 어떻게 가공해서 그런 결론이 나왔는지 전혀 나타나  있지 않습니다.
정확하고 신뢰성 있는 통계 처리 방법에 따라 했는지, 아니면 오류를 섞어서 처리했는지, 전혀 드러나고 있지 않습니다.

다분히 '의도적인' 결론만 나타나 있습니다.

몇 개의 학교를 분석했는지, 전체 '통계량'은 얼마나 되는지도 전혀 표시가 되어 있지 않습니다. 

이렇게 데이터 처리의 기초가 되는 '통계 방법론'이나 '기초 데이터'가 공개되지 않는 통계 처리 자료는 신뢰성이 없습니다.

어떻게 이런 결과를 얻었는지 전혀 알 수가 없어서 '검증'할 수 없기 때문입니다.



실례로, 정두언 의원이 공개했다는 자료를 보면, 인천, 대전, 충북 지역의 경우, '수리 가' 영역에서 1, 2등급을 맞은 학생들이 전혀 없는 걸로 나타나고 있습니다. 이거는 도저히 있을 수 없는 일이지요? (수능은 백분위% 상대평가임)

결국 기초데이터 처리가 잘못되었다고 강하게 추정할 수 있습니다.

더욱이 '전교조 가입률 5% 미만'과 비교하면, 그 반대편에서 대칭되는 카테고리는 당연히 '전교조 가입률 95% 이상'과 비교해야 하는 것이 적절합니다. 양 극단에서 비교해야 하는 것이죠.



그런데, 정두언 의원 자료는 '전교조 가입률 5% 미만'과 '전교조 가입률 40% 이상'을 비교하고 있어서 애초에 시작부터 설득력이 없는 잘못된 통계 처리 자료입니다.


[전교조 가입률이 높을수록 학생들의 수능성적이 높다]

한편, 정두언 의원이 발표한 자료를 보면, 전교조 가입률이 높을수록 학생들의 수능성적이 높은 것으로 나타나고 있습니다.

아래 그래프를 보겠습니다.



정두언 의원이 발표한 자료를 가지고, 그래프를 그려본 것입니다.

위의 방법론에 따라, 비교의 대상이 되는 다른 변수들은 동일한 조건으로 유지했습니다.

* 전교조 가입률(%) = 전교조 지역별 가입률 평균 (서울, 부산, 대구, 인천, 광주, 대전, 울산, 경기, 강원, 충북, 충남, 전북, 전남, 경북, 경남, 제주, 정두언 의원이 위에 발표한 자료 수치)

즉, '전교조 40% 이상인 학교들'만 기초 집단으로 해서, '전교조 가입률'과 '수능 1,2등급 비율'이 어떤 상관 관계를 나타내는지 분산형 그래프로 나타내 본 것입니다.

그리고 그 위에다 엑셀(excel)로 선형 추세선을 분석해서 넣어 보았습니다.

전교조 가입률이 높을수록, 수능 1,2등급 비율이 확연하게 높다는 것을 알 수 있습니다.



다음으로, '전교조 가입률 5% 미만인 학교들'만 기초 집단으로 해서,  '전교조 가입률'과 '수능 1,2등급 비율'이 어떤 상관 관계를 나타내는지 분산형 그래프로 살펴보았습니다.

그리고 그 위에다가 추세선을 넣어보았습니다.

역시 마찬가지로 전교조 가입률이 높을수록 수능 1, 2등급 비율이 확연하게 높아지는 것을 알 수 있었습니다.


그러면, 반대로 전교조 가입률이 적을수록 수능 1,2등급 비율은 어떻게 되는지 확인해 보겠습니다.



'전교조 40% 이상인 학교들'만 기초 집단으로 해서, '전교조 비가입률'(%)과 '수능 1,2등급 비율'이 어떤 상관관계를 나타내는지 그래프로 표시해 보았습니다.

그리고, 그 위에다가 추세선을 그려보았습니다.

전교조에 적게 가입되어 있을수록 학생들의 수능 1,2등급 비율이 확연하게 떨어지는 것을 확인할 수 있습니다.



'전교조 5% 미만인 학교들'만 기초 집단으로 해서, '전교조 비가입률'(%)과 '수능 1,2등급 비율'이 어떤 상관관계를 나타내는지 그래프로 표시해 보았습니다. 

마찬가지로 그 위에다가 추세선을 그려보았습니다.

전교조에 적게 가입되어 있을수록 학생들의 수능 1,2등급 비율이 역시 확연하게 떨어지는 것을 확인할 수 있습니다.
(역추세선을 그리고 있기 때문입니다.)

결국, 정두언 의원이 발표한 자료를 정확하게 처리하면,
동일한 비교 집단에서 전교조 가입률이 높을수록 학생들의 수능 1,2등급 비율이 높게 나타남을 확인할 수 있습니다. 

그러므로 전교조 가입률과 학생들의 성적은 결코 역비례 상관관계가 아님을 알 수 있습니다.
(더 정확하게 말하면, 전혀 상관관계를 따질 이유가 없습니다.)


[노동조합과 수능성적 연계가 과연 적절한가?]

노동조합은 '노조 조합원'의 '권익' 향상을 위해 존재합니다. '노동권'의 영역입니다.
노조 활동을 왜 학생들의 수능성적과 연관시켜 살펴봐야 할까요?

이렇게 이질적인 변수들을 연결시켰다는거 자체가 '넌센스'입니다. 적절하지 않습니다.
결국 '노동운동 탄압' 밖에 안됩니다.

정두언 의원은 자신의 홈페이지에 '전교조 명단 공개'를 강행하면서, 이런 신뢰성 없는 자료를 휴일에 추가로 공개했습니다.
과연 그 의도가 뭘까요?

정두언 의원은 '노조활동'과 '노동운동 탄압'을 중단하길 바랍니다. 
'노조 탄압'을 일상화하는 사람은 '국회의원'직에서 당연히 물러나는 것이 바람직합니다. 

더욱이, 국회의원이 수능 1, 2등급을 양산시키라고 마치 '수능 고득점'이 '진리'인 것처럼 논리를 깔고 들어가는 것도 진짜 어처구니 없는 일이지요?

수능은 상대평가이기 때문입니다. 수능 1, 2등급은 절대적 개념이 아니라, 항상 존재하는 상대적 성적 개념입니다.
수능 1, 2등급은 '국어 90점, 100점' 이런 점수가 아니라, 수능성적 상위 '1%, 2%, 4%, 5%' 이런 식의 백분위(%) 상대 평가입니다.

결국 전체 국민을 대변해야할 국회의원이 '남 깔아뭉개고 올라서라' 교육현장에서 그러고 있는 것 밖에 안됩니다.
진짜 어이가 없다고 볼 수 밖에 없습니다. 지지(gg)치고 사퇴하세요.


[관련글]
정두언 홈페이지, 전교조 명단공개 지지(gg)한다
조전혁 전교조 명단공개, '자유의 침해'가 과연 '자유주의'인가?
전교조 명단공개, 학부모 알권리 존재할 수 없다 
조전혁 홈페이지, 정보공개 '창구' 될 수 없어, 어떤 경우든 위법
전교조 명단 공개, 실물 사진 공개합니다



맞춤검색

,


미디어법이 최근 정국의 주요 이슈가 되고 있습니다. 6월 25일 100분토론에서도 '미디어법'논란, 그 해법은? 이란 주제로 이에 대해 토론하였습니다.
그런데 토론자로 나온 한나라당 나경원 의원께서 재미있는 자료 해석법을 보여주어서 여기에 소개할까 합니다.
이슈가 되고 있는만큼 함께 보기에 충분한 가치가 있다고 생각합니다.

나경원 의원은 백분토론에서 '미디어발전위'(미디어발전국민위원회) 보고서를 인용하면서 다음과 같이 주장했습니다.
(사실 '듣보잡' 보고서인데, 왜 자기들끼리만 보는지 모르겠네요.)

먼저, 나경원 의원의 자료해석 능력을 보겠습니다.


MBC 100분토론


"미디어발전위 보고서에서 본 바에 따르면,

진입규제가 완화되면 방송시장 산업의 부가가치가 증가했다.
그래프의 파란색은 <방송산업 부가가치 증가율>, 빨간색은 <우리나라 전체경제 부가가치 증가율>이다.

자료를 보면, <방송산업 부가가치 증가율>이 <우리나라 전체경제 부가가치 증가율>보다 높은 시기가 2번 있었다.
1995년과 2003년 부근이다. 이 때, 1995년 SO 진입규제 완화, 2001년 PP 진입규제완화가 있었다.

이게 무엇을 의미하는가 하면,
1) 진입규제가 완화되면, 방송시장 산업의 부가가치가 증가했다.

2) 이 때를 보면 피용자의 보수가 증가했다.
---> 따라서, 고용인구가 늘어났다는 것을 의미한다." (이상, 나경원 의원의 주장)




그냥 글만 쓰면, "그건...오해다..."라고 할까봐, 이해의 편의를 위해 직접 말한 내용을 첨부해 드리겠습니다.
(공익의 목적이고, 주장하신 내용이 널리 퍼지는 것을 원하실 것이나, 원치 않으면 댓글 주시면 내려드리겠습니다.)


이런 주장이 맞는가 살펴보겠습니다.


1. 진입규제가 완화되면, 방송시장 산업의 부가가치가 증가했는가?


미디어발전위 자료, 나경원 의원 인용


나경원 의원이 제시한 자료에 따르면, <방송산업 부가가치 증가율>은 A영역, B영역에서 증가했습니다.
따라서, 언뜻 보면 그런 것처럼 보일 수도 있습니다. 그러나,


규제완화 이후에 급격히 침체한 방송산업 부가가치 증가율


동일한 위 자료를 보면, 굵게 파란색으로 칠한 부분은 급격히 떨어지고 있습니다. 오히려 <방송산업 부가가치 증가율>이
<전체경제 부가가치 증가율>보다도 못미치고 있습니다.

이걸 어떻게 설명해야 하죠?

나경원 의원의 명제가 성립하려면, SO진입규제완화 이후에 지속적으로, 또, PP진입규제 완화 이후에 지속적으로 상대적인 부가가치 증가율이 높아야 합니다.

그러나, <방송산업 부가가치 증가율>은 일시적으로 1~2년 정도에 머무르고 있으며, 이후에는 급격히 떨어져서 전체경제의 평균에도 미치지 못하고 있습니다.

이게 무엇을 의미할까요?  나경원 의원의 말처럼 "규제가 완화되면 산업의 부가가치가 증가했다"고 해석해야 하는 것일까요?

오히려, "규제완화"라고 포장된 인위적이고 급격한 정책 충격이 큰 해답이 될 수 없다는 것을 의미하는 것이 아닙니까?
왜냐하면, 휴유증을 남기고 있고, 두 번의 정책 충격의 효과가 모두 일시적인 것으로 나타나고 있기 때문입니다.
지속성이 없는 것이죠?

나경원 의원의 논리를 따르면, SO진입 규제완화, PP진입 규제완화가 '부가가치'와 연관되는 지속적인 효과를 가지고 있었다면, 이미 '미디어법'이라는 추가적인 정책 조치도 아예 필요가 없었어야 합니다.

따라서,
미디어산업의 규제문제를 단순히 "산업의 부가가치"로 따질 수 없다는 결론이 나옵니다.


2. 다음으로, 피용자의 전체 보수가 증가하면, 고용인구가 반드시 늘어나는가?

나경원 의원은 피용자의 전체보수가 증가했기 때문에, 고용인구가 늘어났다는 것을 의미한다고 단정했습니다.

이게 반드시 맞는 말일까요? 하나의 가능성일 수는 있습니다.

그러나 전체보수가 증가해도, 고용인구가 의미있게 비례하여 늘어난다고 단정할 수 없습니다.
왜냐하면,

1) 평균임금이 증가해서 전체보수가 증가했을 수 있습니다.
예컨대, 물가상승과 임금인상 요인입니다.

2) 특정 산업에서 유별나게 고용인구가 늘었다기 보다는, 전체 경기 흐름에 따라서 해당 산업의 고용인구도 영향을 받았다고 볼 수 있습니다. 즉, 불황기에는 전반적으로 고용이 줄어들고, 활황기에는 전반적으로 고용이 늘어난다는 것입니다.

3) 임금상승이 해당 산업 내에서도 특정 인구에게 집중, 편향되었을 수 있습니다.
 (예를 들어, A가 100만원, B가 100만원 임금 받다가, A가 100만원, B가 200만원 임금을 받게 되었다면, 전체 임금은 늘어납니다. 그러나 고용이 늘어난 것은 아닙니다.)


3. 자료에서 왜 연도는 뭉개뜨리고 있는가?
그리고 이거는 자료의 신뢰 문제인데, 화면을 잘 잡아주지 않아서 안보였는데, 자료의 뒷부분은 2005-2006-2007년 식으로 가고 있는데, 앞부분이 몇 년인지 확인이 안되고 있습니다.


순차적으로 보면 "몇 년??" 부분은 2000년이어야 하는데, SO진입(1995)은 1995년으로 소개되고 있습니다.
중간에 짤라먹었나요? 자료 구성의 신뢰성이 떨어진다는 것이지요. 연도를 왜 짤라먹나요?


[요약]

위에서 살펴본 바처럼,
나경원 의원의 주장은 <자료해석의 오류>를 범하고 있습니다. 자료해석 능력의 한계를 보이고 있고, 자료를 잘못 해석하고 있습니다.
나경원 의원이 제시한 자료에 따르면,
방송산업에서 규제완화의 효과는 일시적이고 지속적인 효과가 없는 충격요법에 불과하다는 결론이 나옵니다.

이는, 방송산업은 <부가가치>만이 아닌, 전반적인 사회적, 통합적인 관점에서 고려되어야 한다는 것을 의미합니다. 

한편, 피용자의 보수가 증가했으므로, 고용인구가 따라서 크게 증가했다는 근거는 없습니다. 
또한, 앞으로 방송산업 피용자의 보수가 일반적인 임금상승률을 능가할 것이라거나, 이것이 고용인구의 증가에 크게 기여할 것이라는 근거가 어디에도 없습니다. 

나경원 의원은, 미디어법은 소위 '전문가'들이 논의해야 한다고 했습니다. 해당 위원회에 소속된 나의원 '본인'은 이런 그룹에 속한다고 할 수 있습니다.

그런데, 나경원 의원의 자료해석 능력을 보면, 위와 같이 오류를 범하고 있습니다.

아니 '전문가'라고 자칭하시는 분이... 저 같은 범생(凡生)보다 못한 '자료해석 능력'이 나타나니, 어찌 신뢰할 수가 있겠습니까?


자료 폐기하고, 더 똑똑한 국민 말이나 잘 들으시기 바랍니다. 국민은 '진짜 전문가'를 원하거든요.



맞춤검색

,

(★ 검색으로 결과를 얻어보세요. Let's Search ★)



--> I'm Lucky 최근글 <--