티스토리 뷰
몇 달 전에 읽었던 책인데, 며칠 전 <모두 거짓말을 한다> 를 읽고 이 책이 생각나서 다시 읽어봤다. 저자는 UC버클리를 졸업하고 1999년 하버드 수학박사 학위를 딴 다음 MIT 에서 더 박사후과정을 거친 후 버나드 칼리지 수학과 종신교수를 했다가 2007년 교수 자리를 때려치고 헤지펀드 D.E. Shaw 의 퀀트로 일했지만, 얼마 후 금융위기를 계기로 월스트리트를 떠났다. 그 후 알고리즘을 감사하고 위험성을 측정하는 기업을 설립해 빅데이터가 불평등을 확산하고 민주주의를 위협하고 있다는 사실을 널리 알리는 데 힘쓰고 있다고 한다. 책 표지에 나온대로 "대단히 흥미롭고 굉장히 심란케 하는 책" 맞다. 읽는 내내 속상해지고 답답해지고 화도 나고 무력감도 느껴진다. 그렇지만 쉽게 손을 놓을 수 없는 내용들이다. 바다 건너 먼 나라의 나와 상과없는 문제들이 아닌, 우리 모두의 문제이기 때문이다.
컴퓨터와 인터넷의 발달로 정보화 사회라는 말이 퍼질 무렵, 그 '정보' 란 그저 '지식' 정도로만 생각했었다. 일부만 독점하는 지식을 누구나 쉽게 서로 공유할 수 있는 평등한 사회가 될 것이라고 상상했었다. 인터넷으로 지식의 공유는 더 쉽고 빨라졌지만, 오히려 넘쳐나는 정보 속에서 거짓이 더 널리 퍼졌고 그 속에서 진실은 더욱 찾기 어려워졌다. 더구나 빅데이터 시대에 진실은 더 이상 중요하지 않다. 그보다는 실용성과 이익 추구가 더 중요하다. 쓰레기 같아 보이는 모든 유형의 데이터가 각종 수학모형과 알고리즘을 구축하기 위한 재료로 사용되고, 아무리 사소한 개인정보라도 사고파는 대상이 되었다. 빅데이터 기술은 기업들에게 혁신을 가져다 주었고, 많은 사람들이 더 편리하고 풍족한 삶을 살게 되었다고 믿었다. 하지만 저자는 눈부신 빅데이터 기술은 오히려 더 많은 사람들에게 재앙이 되었다고 주장한다. 대량살상무기(Weapons of Mass Destruction) 가운데 글자를 살짝 바꾸어 대량살상수학무기(Weapons of Math Destruction), 줄여서 WMD 라고 부르며 WMD 가 수많은 사람들을 벼랑으로 내몰고 그들의 삶을 파괴하는 모습을 고발하고 있다.
WMD 의 실체를 들여다보기 위한 여행은 미국 금융위기로 시동을 걸고, 1980 년대로 돌아가 원조격 WMD 라고 볼 수 있는 미국 대학 줄세우기를 살펴보며 본격적으로 시작한다. <유에스 뉴스 & 월드 리포트> 는 경쟁사를 제치기 위한 돌파구로 미국 전국의 1800 개 대학교에 순위를 매기는 프로젝트를 감행했다. 처음에는 설문조사만 가지고 순위를 매겼다. 대학 순위 매기기 프로젝트는 독자들에게 큰 인기를 끌었지만, 불공정하다는 대학들의 반발에 부딪혔다. 이에 <유에스 뉴스> 는 데이터를 기준으로 대학 순위를 매기는 모형을 도입하기 시작했다. 하지만 어떤 데이터를 기준으로 삼아야 할까? 그들은 명문대학들을 특별하게 해주는 특성이 무엇인지 조사를 했던 것이다. 하버드, 스탠퍼드, 프린스턴, 예일 같은 대학들이 그들이 세운 기준에 따라 순위를 매긴 결과 상위권에 있어야만 그 순위가 신뢰를 얻을 수 있기 때문이다. 이미 자타공인 명문인데 이들이 하위권에 있으면 그들의 대학 순위 매기기는 엉터리로 놀림받았을 것이다.
미국 대학을 줄세우기 위한 기준은 15개 정도 되었는데, SAT 점수, 학생 대 교수 비율, 입학 경쟁률, 신입생 잔류율, 졸업률, 기부금, 평판 같은 것들이었다. 대학 순위 매기기가 사람들의 관심을 받고 점점 더 인기를 얻자, 마침내 이 잡지사에서 발표하는 대학 순위는 대학의 운명을 좌지우지할 정도로 큰 영향을 끼치게 되었다. 한 번 순위가 떨어지면 우수한 학생들과 교수들은 그 대학을 기피하고 되고, 그 때문에 점점 더 순위가 떨어지게 된다. 그 결과 대학들은 교육의 질을 높이기 위한 노력보다는, 순위를 평가하는 특정 항목에서 다른 대학들보다 더 높은 점수를 받기 위한 노력을 더 많이 하게 되었다. 대학마다 고유의 가치를 추구하고 다양한 개성을 발휘하는 것보다 획일적인 평가 기준에 맞춰 경쟁하는 것이 더 중요해졌다. 평판 점수를 올리기 위해 홍보에 열을 올리고, 심지어는 순위 평가에 사용되는 데이터를 조작하기도 했다. 더구나 이 평가가 '상대평가' 였기 때문에 그 왜곡된 노력은 더욱 심화되었다.
저자는 미국 대학 등록금이 비싼 이유로 대학 순위 매기기를 지목했다. 미국 대학 학비는 30년 동안 고공행진하여 500% 이상 증가했다. 대학 순위 평가 기준에는 저렴한 학비나 학자금 지원 같은 것이 없었다. 애초에 순위 평가 기준은 명문 대학을 모델로 한 것인데 그 대학들은 학비가 비싸다. 그러므로 저렴한 학비를 평가 기준으로 만들면 명문 대학들의 순위를 떨어뜨릴 수 있는데, 그러면 앞서 말한대로 순위의 신뢰성이 의심받을 수 있기 때문에 저렴한 학비는 중요한 평가 항목으로 삼을 수 없었던 것이다. 대학 총장들은 순위 평가 15개 항목에서 성과를 극대화하는 의무가 지워졌다. 인기를 얻고 평판 점수를 얻기 위해 호화로운 기숙사, 암벽 등반 시설과 월풀 욕조를 갖춘 체육관 등 건축 바람이 불기도 했다. 어차피 저렴한 학비는 대학 순위 평가에 사용되지 않으므로, 다른 항목 점수를 올리기 위한 자금을 마련하기 위해 학비를 올렸다. 일부 대학들은 상당한 학자금 지원 예산을 책정하기도 했는데, 우수한 학생들을 유인하기 위한 목적이었기 때문에 절대적으로 학자금이 필요한 학생들에 대한 지원은 오히려 줄어들었다.
대학들은 순위를 올리기 위해 학생들을 투자 포트폴리오처럼 관리했다. '최적화' 라는 이름으로 이상적인 학생들을 모집하고 선발하기 위해 외부 기업에 의뢰하기 시작했다. 이런 기업들의 알고리즘은 등록 가능성이 높은 학생들을 지역, 성별, 인종, 전공, 성적 등에 따라 순위를 매긴다. 중위권 대학들은 등록률을 높이기 위해 성적이 뛰어나도 등록 가능성이 낮은 지원자들을 떨어뜨리는 알고리즘을 도입하기도 했다. 이 때문에 우수한 학생들조차 안정권이라고 생각했던 대학에 떨어지는 일이 발생했다. 이에 발맞추어 교육컨설팅, 아니 입시컨설팅 사업이 발달했다. 숙박비 별도의 4일짜리 '대학원서 집중 캠프' 의 참가비는 무려 1만6000 달러라고 한다. 캠프 기간동안 자기소개서 작성, 대입 면접 전략, 동아리 활동이나 봉사 활동 등 학교 외 활동 목록을 작성한다. 이 외에도 대학 입시 관련한 고가의 서비스를 제공하는 수많은 사업들이 번창하고 있다고 한다.
자식을 미국으로 일찍 유학보낸 한국 부모들이 미국에서 과외 열풍을 일으켰다는 소문을 들은 적이 있는데, 혹시 그 사람들이 미국의 입시컨설팅 사업에서 상당 부분을 차지하고 있지는 않을까 궁금하기도 하다. 이러한 미국의 교육 현실에 대한 얘기는, 한국인으로서 참 공감이 간다. 80년대 학력고사 시절 부모님을 도와 리어카를 밀며 연탄을 날랐던 학생이 열심히 공부해서 법대를 가고 판사가 되었다는 전설은 말 그대로 전설이 되어버린 지 오래이다. 돈이 없으면 남들보다 더 공부를 잘 하기 힘들다. 그런 교육 시스템 자체가 저소득층을 소외시키고, 극심한 양극화를 초래하고 있다. 중산층도 입시컨설팅 서비스와 비싼 대학 학비로 큰 부담을 지고 있다. 결국 일부 특권층을 제외하고는 모두 피해자가 된다.
영리 대학들은 WMD 를 더욱 적극적으로 사용하여 빈곤층의 삶을 약탈하고 있다. 미국 고등교육법에는 대학들이 재정의 최대 90% 까지 연방정부의 원조를 받을 수 있는 조항이 있는데, 그 덕분에 영리 대학들은 학생들이 어떤 식으로든 수천달러만 마련할 수 있다면 그 학생들의 이름을 빌려 그 9배나 되는 돈을 정부에서 지원받을 수 있었다. 학생들이 빚을 지고 학자금 대출을 받아 대학에 등록금으로 내면, 대학들은 그 돈으로 이익을 얻는 것이다. 이러한 영리 대학들의 표적은 우수한 학생들이 아니라 빈곤층의 학생들이다. 가난을 벗어나려면 대학을 나와야 하고, 대학을 나오면 사회에서 성공할 수 있다며 졸업생 취업률을 조작하기도 한다. 그들은 TV 와 전화, 우편, 인터넷 광고를 이용하여 빅데이터를 수집하고 베이즈 접근법이나 A/B 테스트 등의 각종 빅데이터 분석기법을 총동원하여 최적화 알고리즘, 즉 WMD 를 만들어낸다. 그것으로 절박한 환경에서 고통받는 취약한 사람들을 귀신같이 찾아내 집중 공략을 해서 학자금 대출을 받아 자기 대학에 등록금을 내도록 만든다. 그렇게 다년간의 경험과 데이터를 쌓아가는 동안 그들의 WMD 는 더욱 정교해지고 파괴력은 커지고 있다.
미국상원교육위원회와 검찰에서 밝힌 바에 따르면, 일부 영리 대학과 직업 훈련 학교에서 신입생 모집원에게 자긍심이 낮고, 돌봐주는 사람이 거의 없으며, 어려움에 처해있고, 계획을 제대로 세우지 못하고, 고립되고, 조급한 사람, 혹은 복지 수당을 수령하고 자녀가 있는 편모, 임신한 미혼여성, 최근 이혼한 사람, 저임금 종사자, 신체 정신적 학대자, 최근 출소자, 약물 중독 재활 치료 유경험자, 장래가 없는 직종 종사자 등을 집중 공략하라고 지시했다고 한다. 그런 영리 대학들의 학비는 주요 공립대학들보다 20% 정도 더 비싼데, 실제 고용 시장에서 그 대학들의 졸업장은 고등학교 졸업장과 똑같이 취급된다. 영리 대학들이 학생들을 유치하기 위해 투자하는 학생 1인당 마케팅 비용은 교육비의 몇 배라고 한다. 결국 이런 영리 대학을 졸업한 학생들에게 남는 것은 쓸모없는 졸업장과 막대한 빚이다. 빅데이터 분석을 바탕으로 한 약탈적 광고는 영리 대학 뿐 아니라 소액대출업체 등 여러 기업들의 마케팅 수단으로 활용되어 더욱 많은 취약 계층 사람들에게 손을 뻗치고 있다. 이러한 미국의 영리 대학의 현실은 스스로 '취업 사관학교' 를 자처하는 한국의 대학들을 생각나게 한다. 정말 그 대학들을 졸업하면 취업이 잘 되는 걸까? 안정적인 정규직 자리를 얻을 수 있는 걸까? 불필요하게 대학 졸업장을 강요하고 학력을 차별하는 사회가 도움이 필요한 학생들을 취업하기도 전에 오히려 빚더미의 수렁으로 빠뜨리고 영리 대학들의 배만 불려주고 있는 건 아닐까?
빅데이터 기술은 수집한 데이터를 바탕으로 만들어지지만 그 자신이 필요로 하는 데이터를 다시 찾아내 자동으로 수집하고 분석한다. 그 외에도 효율성과 신속성 정확성 같은 목표 아래 많은 일들이 자동화되었다. 사람이 하던 일을 이제는 알고리즘이 대신 한다. 알고리즘은 사람이 만든다. 대상을 평가하는 알고리즘은, 사람이 자신의 가치관을 심어놓고 그에 따라 대상을 평가하게 만든 프로그램이다. 만약 편견을 가지고 있는 사람이 완벽한 알고리즘을 만든다면, 그 알고리즘은 사람의 편견을 완벽하게 재현한다. 이력서를 자동으로 심사하거나, 신용을 평가하거나, 보험료를 책정하는 등 많은 일들이 자동화되고 있는데, 이 때문에 불평등은 더욱 확산되고 고착화되고 있다. 미국 기업들은 온갖 수단 방법을 가리지 않고 개인의 정보를 수집하여 이른바 e점수라는 신용평가 점수를 매겨 개인의 경제적 가치를 평가하고 있다고 한다. 급여, 직업, 주거 형태, 총부채, 구매 이력, 우편번호, 인터넷 사용 패턴, SNS 활동 내역 등등 사람들이 온오프라인 모든 곳에서 남기는 모든 흔적들을 채취하고 심지어는 그들의 가족이나 친구들 정보까지 동원한다. 주로 데이터 브로커 기업들이 이런 일들을 하고 있으며, 그렇게 만들어 놓은 정보들을 다른 기업에 팔기도 한다. 이렇게 빅데이터를 이용한 개인 평가는 상관관계를 근거로 한다. '당신은 누구인가? 가 아니라, 당신은 어느 무리에 속하는가? 를 기준으로 당신을 평가한다' 는 것이다. 만약 몇가지 특성이 중요한 평가 기준과 상관관계가 있다는 것을 발견하면, 그 몇가지 특성을 기준으로 사람을 분류한 다음 같은 집단에 속한 사람들을 모두 똑같이 평가하고 다른 집단에 속한 사람들을 차별한다.
예를 들어, 범죄율이 높은 지역에 거주하고 있는 사람이라면 잠재적인 범죄자로 평가받고 불시에 경찰의 검문을 더 많이 당하게 된다. 자동화된 알고리즘을 도입한 콜센터는 고객의 데이터를 순식간에 검색하고 서열화해서 더 많은 수익이 예상되는 집단으로 분류된 고객은 상담원과 곧바로 연결해주는 반면, 그렇지 않은 고객은 더 많이 대기시킨다. 금융회사에 대출을 신청한 사람의 우편번호가 부유층이 주거하는 지역의 우편번호라면 신용평가 점수가 올라가서 신용한도가 높아지고 금리는 낮아지는 반면, 빈곤층 지역의 우편번호라면 거절을 당하거나 리스크가 높은 집단으로 분류되어 신용한도는 낮아지고 금리는 높아질 확률이 높다. 일자리를 제 때 구하지 못해 학자금 대출 상환을 연체한 기록이 있는 사람의 채용 지원 이력서는 자동 심사에서 탈락할 확률이 높다. 자동차 보험회사는 무결점 모범 운전을 자랑해도 운전이 생계수단이며 신용점수가 낮은 가입자에게는 더 높은 보험료를 부과한다. 이런 일들이 미국만의 일이라고 볼 수만은 없다. 빅데이터 기술은 국경이 없기 때문이다.
미국 경찰이 범죄 통계와 확률을 기반으로 한 범죄 예측 프로그램을 도입하여 활용하는 사례들, 그 중 특히 뉴욕의 사례를 많은 책에서 다루고 있는데 이 책에서도 상세한 내용이 나온다. 그 유명한 '깨진 유리창 이론' 을 계기로 무관용 운동이 퍼져 이전에는 훈방으로 그쳤을 경미한 반사회적 행동도 강력한 처벌의 대상이 되었고, 경범죄를 단속하면 더 큰 범죄를 예방할 수 있다는 통념이 일반화되었다. 기술이 발달하면서 과거 각 범죄 유형과 발생 장소, 시점 등의 데이터를 취합해 범죄 발생 확률을 계산하여 예측하는 프로그램이 개발되었다. 경찰 인력을 특정 시점 특정 지역에 집중적으로 배치해 효율적으로 운용하며 범죄를 더 효과적으로 예방하려는 목적이었다. 이 프로그램들은 살인, 방화, 강도, 성폭행 등 강력범죄 뿐 아니라 경범죄까지 범죄 예측 모형에 포함시켰다. <괴짜경제학> 에서 그런 범죄 예측 프로그램은 효과가 없다고 주장하기도 했지만, 많은 시민들은 그 '혁신적인' 프로그램을 신뢰하고 범죄 예방 효과를 믿었다. 문제는, 이런 범죄 예측 프로그램이 특정 계층을 겨냥하고 있다는 것이다.
일반적인 경찰, 즉 흔히 보는 양산형 경찰들은 경제 범죄 행위를 적발하고 처벌할 능력이 안된다. 조직적이고 지능적인 화이트칼라 범죄자들에 대응하려면 그들만큼 고학력에 지능이 뛰어나고 법적 지식까지 풍부하게 갖춘 인재와 그들을 지원하는 강력한 권력을 보유한 조직이 필요하다. 그런데 그런 인재와 조직을 유지하려면 비용이 많이 든다. 게다가 서로 감싸주며 똘똘 뭉치는 막강한 조직력과 사회적인 영향력을 갖추고 법조계 인맥에다가 뛰어난 변호사와 정치 권력까지 친구로 두고있는 그들을 검거하고 처벌하려는 시도는 실패할 확률이 높다. 반면 충격적이고 자극적이어서 눈길을 끄는 강력 범죄는 빈민가에서 더 많이 발생하는데, 그런 범죄자들은 대체로 개인이거나 작은 조직이어서 화이트칼라 범죄 조직보다 상대하는 것이 비교적 더 쉽고 그들을 처치한 후 언론을 통해 자랑했을 때 대중적인 효과도 좋다. 그렇기 때문에 경찰들의 범죄자 검거 기술은 대체로 강력 범죄나 기타 폭력 절도 유형의 범죄에 대응하는 것에 치우쳐있다. 과거 범죄 기록이나 통계자료 역시 그런 유형의 범죄에 대한 것이 더 많다. 그러니 범죄 예측 프로그램 역시 그런 범죄에 초점이 맞춰져있다. 상황이 이러다보니 부자 동네보다는 가난한 동네가 범죄 예측 프로그램과 경찰의 표적이 될 수밖에 없다. 경범죄 또한 상대적으로 더 많은 인구가 밀집해 있는 빈민가에서 더 많이 발생하는데, 경찰들이 순찰하다가 경범죄 현장을 발견하면 그냥 모른 척하고 지나칠 수 없다. 그러다 보면 빈민가 지역의 경범죄 검거 건수가 늘어나고, 그런 경범죄 발생 기록은 또 다시 범죄 예측을 하는 데 사용되며, 그 지역은 점점 더 범죄 발생 확률이 높은 지역으로 분류된다. 그 결과 그 지역에 더 많은 경찰들이 투입되며, 더 많은 사람들이 사소한 경범죄로 처벌받는다. 그리고 경찰들은 높은 실적을 기록하고 시민들의 칭찬과 지지를 받는다. 그 덕분인지는 확실치 않지만 어쨌든 범죄율은 줄어들고 있으니 말이다.
뉴욕에서 범죄 예측 프로그램 도입 이후 힘을 얻은 경찰은 단순한 순찰을 넘어 무제한에 가까운 불심검문 권한까지 거머쥐게 되었다. 사복을 입고 무리를 지어 다니면서 단지 의심이 간다는 이유로 아무 죄 없는 사람들을 붙잡아 벽이나 자동차에 두 팔을 짚고 다리를 벌리게 하고 몸수색을 하며 심할 경우 땅바닥에 넘어뜨리고 팔부터 꺾기도 한다. 신분 조회를 해서 범죄 전과가 나오면 그동안 또 다른 범죄를 저질렀을 지도 모른다는 추측으로 자동차에 태운 다음 차 안을 다른 '범죄자' 들로 가득 채울 때까지 몇시간이고 가둔 채 시내를 돌아다니기도 한다. 경찰서에서 조사 결과 아무 죄가 밝혀지지 않으면 그 때서야 풀려나는 것이다. 보상이나 사과는 커녕 지켜보고 있으니 조심하라는 경고와 함께 말이다. 이런 식의 마구잡이 저인망 범죄 사냥 정책으로 많은 사람들이 억울하게 피해를 입었으며, 상당수는 경찰에 항의하는 바람에 체포불응 혐의가 추가되기도 했다. 뉴욕 경찰청 프로그램 데이터를 분석한 결과 불심검문 대상자의 85% 가 젊은 흑인이나 라틴계 남성이었다고 한다. 그런데 그 중 강력 범죄와 연루된 경우는 0.1% 에 불과했다고 한다. 하지만 그 0.1% 를 근거로 사회적 취약 계층의 삶이 이런 식으로 점점 더 파괴되어 가는 것이 정당화된다.
저자는 이렇게 원인이 결과가 되고 그 결과가 다시 원인이 되는 악순환을 피드백 루프라고 부른다. <가난은 어떻게 죄가 되는가> 라는 책을 보면 이보다 더 심한 다양한 사례가 아주 상세하게 나와있다. 뉴욕 같은 곳에서 80년대 한국의 삼청교육대 시절 같은 일들이 벌어지고 있다니 참 놀라운 일이다. 미국 같은 선진국은 자유와 평등과 인권을 소중하게 여기고 백 명의 범죄자를 놓치더라도 한 명의 무고한 피해자가 생기면 안된다는 무죄 추정의 원칙을 지킨다고 생각했는데, 전혀 그렇지 않은가보다. 이쯤에서 한가지 궁금해지는 게 있다. 경범죄 단속으로 강력 범죄를 예방할 수 있다면, 그러니까 예를 들어 길거리에 담배꽁초를 버리거나 무단횡단을 하는 사람을 족치면 그 사람이 나중에 살인자가 되는 것을 예방할 수 있다면, 화이트칼라 범죄자들이 사소한 작은 범죄를 저지를 때 미리 족쳐서 나중에 수천 수만명의 생계를 위협하는 어마어마한 큰 범죄를 저지르는 것을 예방할 수 있지 않을까? 화이트칼라 범죄는 불심검문으로 예방할 수 없는 것일까? 왜 그런 것은 아무도 연구하지 않을까? 경찰들이 빈민가에서 지나가는 사람들 그냥 막 몸수색하듯, 국체성에서 그냥 막 툭하면 회사들에 들이닥쳐서 회계부서 컴퓨터와 장부를 뒤지면 안되나?
운나쁘게 경범죄로 걸려든 사람들은 그 날만 운이 나쁜 게 아니다. 그 '범죄 기록' 이 남아, 이후에 또 다른 죄로 잡히면 재범 위험이 높은 사람으로 분류되어 더 큰 처벌을 받는다. 미국 20여개의 주에서는 '재범위험성모형' 을 개발하여 범죄자의 재범 위험성을 평가하고 양형 기준으로 삼는다고 한다. 재범위험성모형은 범죄자 당사자뿐 아니라, 주변 인물들이나 그와 비슷한 특징을 가진 다른 범죄자들의 재범율까지 참고하여 재범위험성을 평가한다고 한다. 빈민가에는 비교적 흑인들이 많은데, 그 역사는 남북전쟁 이후 노예 해방 시기까지 거슬러 올라간다. 해방된 가진 것 없는 노예들이 차별이 심한 농촌을 떠나 도시로 흘러들어 오면서 제대로 된 일자리를 얻지 못한 채 빈민촌을 형성한 것이 현재까지 이어져 오고 있는 것이다. 더 나은 삶을 살 기회가 적은 빈민가의 열악한 환경 속에서 살면 상대적으로 범죄의 유혹에 빠지기 쉽기 때문에 청소년기부터 크고 작은 범죄 이력들을 가지게 된 경우가 많다. 이런 현실을 바탕으로 재범위험성모형을 개발하면 당연히 흑인의 재범위험이 높다는 결과가 나올 것이다. 사람들이 왜 범죄를 저지르고 어떻게 해야 범죄를 저지르지 않게 할 수 있는가는 중요하지 않은 것이다. '재범을 저지를 위험이 큰 집단으로 분류된' 사람들을 더 나은 사회의 일원이 될 수 있게끔 해주는 것보다 되도록이면 더 오래 사회에서 격리시키는 것이 중요한 것이다. '재범위험성모형' 은 바로 그런 목적으로 만든 WMD 이다. 미국시민자유연맹에 따르면, 비슷한 범죄를 저지른 백인들보다 흑인들에게 선고된 형량이 20% 정도 더 길다고 한다.
빅데이터 기술은 기업의 효율성과 생산성을 극대화하는 데에도 적극 이용된다. 이 때 근로자는 그저 가치를 생산하고 돈을 벌기 위해 적시 적소에 투입되어야 할 '자원' 으로, 아니면 버려야 할 '비용' 으로 취급될 뿐이다. 미국에서 유행한다는 신조어인 '클로프닝clopening' 을 예로 들었는데, 상점이나 카페의 종업원이 밤늦게까지 일하고 퇴근한 다음 몇 시간 후 새벽에 다시 출근하는 것을 뜻한다. 인건비를 아끼기 위해 극도로 빡빡한 일정을 짜서 일을 시키는 것이다. 이런 업무 방식은 주로 스타벅스, 맥도날드, 월마트 같은 기업들의 저임금 노동자들에게 적용된다고 한다. 기업들은 사람을 최소한만 고용해서 최대한 인건비를 아끼려고 한다. '절적한 인력 조정' 은 기업들에겐 돈을 더 잘 벌기 위한 필수 기술이다. 이전에는 사람의 경험과 순발력에 의지해서 예상치 못한 바빠지는 상황에 대처했다. 그러나 빅데이터 기술의 발달로 진화한 일정관리 프로그램은 날씨와 트윗 양과 유동 인구 증감 데이터를 수집해 바빠질 때가 언제인가를 분 단위로 분석하고 예측하는 것까지 가능해졌다. 효율적이고 탄력적인 인력 배치를 통한 수익의 극대화를 위해 개발한 근무일정관리 프로그램은 근로자들에게 갑작스럽고 불규칙한 일정을 요구한다.
2014년 뉴욕타임스는 스타벅스에서 일하며 대학을 다니면서 4살짜리 아이를 혼자 키우는 재닛 나바로라는 고학생 싱글맘에 관한 기사를 내보냈다. 그녀는 클로프닝이 도입되자 빡빡하고 들쭉날쭉한 근무 일정 때문에 보육 시설을 이용하는 것마저 힘들어졌고 학업도 유지할 수 없었다. 미국 정부의 조사에 따르면, 요식업 분야 종업원의 65% 정도, 소매업체 종업원의 절반 정도가 변경된 일정을 길게는 일주일 전에 짧게는 하루나 이틀 전에 통보받는다고 한다. 스타벅스를 포함해서 뉴욕타임스 기사에서 언급된 기업들은 클로프닝 관행을 없애겠다고 발표했으나, 1년 후 후속 기사에서 스타벅스는 여전히 클로프닝을 없애지 못했다고 한다. 매장 매니저급 이상의 모든 관리자들에 대한 성과 평가 기준은 인간의 삶에는 관심이 없었기 때문이다. 저자는 근무일정관리 프로그램은 사실상 저임금 노동자를 착취하고 억압하기 위해 설계되었다고 해도 지나치지 않다고 주장한다. 그 자녀들 또한 마찬가지로 열악하고 혼란스러운 환경에 처하게 되고 더 나은 삶을 살 수 있는 기회를 남들만큼 누리지 못하게 될 것은 자명한 일이며, 그로 인해 빈곤은 또 대물림된다. 뉴욕타임스 기사가 나온 후 민주당 의원들은 일정관리 프로그램을 규제하기 위한 법안을 발의했는데, 다수당인 공화당이 격렬히 반대하여 그 법안은 사장되고 말았다.
여기까지만 보면 중산층 사무직 혹은 전문 기술직 종사자들은 모두 남의 얘기이고 자기와는 상관없다고 생각할 지도 모른다. 하지만 생산성을 측정하려는 빅데이터 기술의 손길은 첨단기술 종사자들까지 평가하여 자동으로 점수화하기까지 이르렀다. 소셜 네트워크와 이메일과 메시지를 분석하여 직원들 중 창조적인 아이디어를 생산하는 창조자와 그 아이디어를 확산시키는 전달자를 발굴하고 평가하는 프로그램을 출시한 회사도 있었다. IBM 과 MS 도 비슷한 목적으로 사내 프로그램을 운영했다고 한다. 심지어는 직원들의 건강을 관리한다는 목적으로 이른바 웰니스 프로그램을 운영하는 회사들이 증가하고 있다고 한다. 웰니스 프로그램은 건강 보험료 등 고용주가 직원의 건강 관리 관련하여 부담하는 비용을 절감하는 차원에서 도입되었는데, 표면적으로는 임직원 복지를 내세우고 있다고 한다. 한 때 삼성이던가, 어느 대기업에서 흡연자들에게 성과 평과에서 불이익을 주는 제도를 도입한 적이 있었는데, 언뜻 보기에는 임직원의 건강을 걱정하는 것 같기도 하지만 그런 제도를 도입한 진짜 이유는 무엇이었을까? 미국 기업들이 직원들을 대상으로 실행하는 웰니스 프로그램은 건강 관리를 내세워 웨어러블 IoT 기기와 센서 등을 동원하여 프라이버시를 침해하고 강제성을 띈 제도이다. 예를 들면 건강 관리 활동을 통해 매년 일정 포인트를 획득해야 하는데, 일지 작성 1건당 1포인트, 의료기관에서 받는 건강검진으로 1000 포인트를 획득하고, 설문지를 작성하거나 목표 설정을 하고 이를 달성하면 더 많은 포인트를 쌓을 수 있다. 만약 목표 포인트를 획득하지 못하면 추가 보험료를 지불해야 한다. 타이어 제조업체 미셰린은 혈압, 포도당 수치, 콜레스테롤 수치, 중성지방 수치, 허리 둘레까지 다양한 기준에 대한 직원 목표치를 설정하고 달성하지 못할 경우 건강 보험료로 연 1000 달러를 추가 부담하도록 했다고 한다. CVS 도 직원들에게 체지방 수치, 혈당 수치, 혈압, 콜레스테롤 수치 등을 보고하도록 하고 만약 보고하지 않을 경우 연 600 달러의 벌금을 내도록 했다고 한다. 이제 최신 데이터 과학은 개인의 업무 역량과 능력 뿐 아니라 신체 정보과 건강까지 점수화하고 있다.
전통적인 인적자원관리 시스템은(HRMS) 채용, 인사, 조직, 근태, 급여, 복지, 교육 등 많은 기능을 탑재하고 있지만 그 중 가장 핵심이 되는 기능은 임직원 평가로, 인재를 발굴하여 보상하고 무능한 직원을 색출해서 도태시키면 직원들에게 동기를 부여하고 성과를 최대화할 수 있다는 사상을 기반으로 한 평가 제도를 구현한다. 정량적 평가, 정성적 평가, 역량, 직무 수행 능력, 목표 설정, 다면 평가, BSC, 멘토링 등등등 수많은 용어를 탄생시키며 발달해온 평가 제도는 아직도 20세기 말 젝 웰치 식 20-70-10 평가 제도의 망령에서 벗어나지 못하고 직원들을 마치 쇠고기처럼 S,A,B,C,D 등급으로 평가하고 분류하는 등 갖은 응용 또는 변형된 모형으로 재생산되고 있다. 평가 제도의 불합리함을 고발하고 기업의 이익과 임직원의 행복 모두 도움이 되는 대안을 제시하려고 노력하는 사람들이 많은데, 주관적인 편견이 개입될 가능성이 많아 객관적인 평가는 불가능할 뿐만 아니라 평가 제도는 팀웍을 해치고 도전 정신을 억압하기 때문에 부작용이 많다는 주장이 많다. 실제로 이런 주장을 받아들인 제너럴 일렉트릭사는 30년만에 젝 웰치식 평가제도를 폐지했다. 하지만 빅데이터 기술의 발달로 그런 변화가 다시 위협을 받고 있다. 박근혜 대통령 시절 공공기관에 성과 연봉제 도입으로 난리가 난 적이 있는데, 많은 사람들은 아직도 '수치로 모든 것을 평가' 할 수 있다는 통념을 벗어나지 못하고 있다. 그런 생각을 가지고 있는 기업 경영진들에게 빅데이터 기술 개발 기업들이 객관적인 평가가 가능하고 진정한 인재들을 추려내는 것이 가능하다고 선전하며 개발해내는 알고리즘과 프로그램들은 뿌리치기 힘든 유혹이다. WMD 의 살상 범위는 단지 저소득층에만 국한되지 않을 수도 있다는 말이다. 실제로 미국의 교사들이 WMD 에 당했다.
1983년 레이건 행정부는 <위기의 국가> 라는 제목의 보고서에서 미국 교육이 실패하고 있다고 발표했다. SAT 점수가 떨어지고 있었기 때문이다. 안좋게 말하면 학생들이 점점 멍청해지고 있다는 것이었다. 그 보고서는 그 원인으로 무능력한 교사를 지목했고, 그들에게 책임을 물어야 한다고 주장했다. 학생들에게 시험을 치르게 한 후, 그 결과를 토대로, 좀 심하게 말하면, 세금만 축내는 무능한 나쁜 교사를 색출해서 없애버려야 한다는 것이었다. 그러니까 교사의 능력과 가치는 곧 학생의 성적이라는 것이다. 그 보고서가 발표된 지 7년 후, 샌디아 국립 연구소에서 데이터 검토 결과 그 보고서에 오류를 찾아냈다. SAT 점수가 하락한 건 사실이었지만, 응시자 수가 크게 증가했던 것이다. 대학들이 경제적 빈곤층과 소수 인종 학생을 더 많이 받아들였고, 이는 그들에게 배움의 길이 열렸다는 신호였고, 그래서 그들은 더 많이 시험을 치르고 대학에 더 많이 지원했다. 평균 점수가 떨어지는 것은 당연했다. 그런데 SAT 응시자들을 소득 수준에 따라 구분하여 평균 점수를 따로 계산해 보았더니, 오히려 모든 계층에서 점수가 상승하고 있었다. 이런 현상을 '심슨의 역설' 이라고 부르는데, 결국 <위기의 국가> 는 데이터를 심각하게 잘못 해석하고 있었던 것이다.
<괴짜 경제학> 에서도 이와 관련하여 2002년 부시 행정부의 '아동낙오방지법 No Child Left Behind Law' 과 관련한 '고부담 시험' 에 대한 내용이 있다. 부시의 아동낙오방지법 시행 이전에도 이미 20~30개 정도의 주에서 시험 성적으로 학교에 표창을 주거나 제제를 가하는 식의 법을 시행하고 있었다고 한다. 시카고에서 시험 점수가 낮은 학교는 보호 관찰에 놓이거나 정부의 보조금이 중단될 수 있었고, 폐교시키겠다는 위협에 시달리기까지 했다. 성적이 낮은 학급의 교사는 승진이나 연봉 등에 불이익을 받기도 했으며 심할 경우 해고되었다고 한다. 또한 시험 점수가 낮은 학생은 다음 학년으로 올라갈 수 없었다. <괴짜 경제학> 에서는 이런 '고부담 시험' 의 불합리함보다는 교사의 부정행위를 밝혀내는 것을 중심으로 이야기를 풀어가고 있다. 저자인 스티븐 레빗은 교사들이 학생들의 답안지를 수정해 성적을 조작한다는 가설을 세웠다. 그렇다. 학생이 컨닝해서 자기 성적을 올리는 게 아니라, 교사가 자기 학급의 성적을 올리려고 학생들의 답안지를 수정한다는 가설이다. 그는 실제로 시카고 학교들의 시험 답안지를 분석하여 교사에 의해 수정된 답안지의 패턴을 찾아내 그런 부정 행위를 저지른 교사들을 적발하고 자백을 받아내기까지 했다. 그 교사들이 낸 시험 문제를 공개해서 실제로도 얼마나 무능력했는지 보여주었는데, 얼마나 한심한 문제였는지 정말 그런 문제를 낸 교사들은 퇴출시켜야겠다는 생각이 들 정도이긴 했다.
반면, 이 책에서는 교사의 부정행위를 포함한 온갖 변수를 감안하지 않고 오직 점수만으로 교사를 평가하는 제도의 불합리함을 비판한다. 2007년 워싱턴DC 시장 에이드리언 펜티는 교육 개혁가인! 한국계 미국인! 미셸리를 교육감으로 임명했는데, 미셸리 교육감은 '임팩트 Impact' 라는 교사 평가 기법을 개발하여 평가점수 하위 2% 에 해당하는 교사들을 무더기 해고하고, 다음 학년 말에는 하위 5% 인 206 명의 교사들을 해고했다고 한다. 째찍만 있었던 것은 아니었다. 학생들이 우수한 성적을 거두면 교사와 행정관은 8000 달러의 상여금을 받을 수 있었다. 근데 이런 '학생 성적 못 올리는 무능한 교사 퇴출법' 시행 시기를 보면 샌디아 국립 연구소의 분석 결과는 무시된 것 같다. 실제로는 학생들 성적이 조금씩 좋아지고 있다는 것을 밝혔는데도 재검토 없이 단지 시험 성적만으로 교사들을 마녀사냥했으니 말이다. 저자는 학생의 점수로 교사의 능력을 평가하는 것이 얼마나 불합리한 지를 알려주는 사례로 두 교사의 사례를 소개한다. 물론 한 두가지 사례를 들어 전체 제도의 불합리함을 주장하는 것도 불합리해 보일 지 몰라도, 왜 그런 일이 일어났는 지를 생각해본다면 특수한 예가 아니라 일반론으로 확장하는 것도 가능하다.
워싱턴의 한 중학교 교사인 새러 와이사키는 2년차 신임 교사였지만 교장과 학부모들에게 아주 좋은 평가를 받고 있었는데, 학생들의 학업 성취도가 낮아 해고되고 말았다. 그녀가 새로 맡았던 학생들의 성적은 전년도에 성적이 매우 우수한 학생들이었는데, 나중에 알고보니 실제로는 그 중 많은 학생들이 단순한 문장조차 읽지 못했다고 한다. 때마침 언론에서 교사들의 답안지 조작이 밝혀져 보도가 되었고, 와이사키는 이런 정황을 들어 교육청에 이의를 제기했는데, 답안 수정은 결정적인 증거가 없는 단지 의심스러운 정황일 뿐이므로 평가에는 잘못이 없다며 받아들이지 않았다고 한다. 다행히 와이사키는 교장과 학부모의 추천으로 북부 버지니아 부유한 학군의 학교에 임용되었다고 한다. 뉴욕의 한 중학교에서 영어를 가르치는 26년차 교사인 팀클리퍼드는 가치부가모형이라고 하는 교사 평가에서 어느 해에 100점 만점에 6점을 받았는데, 다음 해에 똑같은 방식으로 학생들을 가르쳐서 96점을 받았다고 한다.
저자는 이와 관련해서 교사 평가 모형의 여러가지 오류를 지적한다. 교사 평가 모형은 사회적 불평등을 반영하기 위해 학생 각자가 받을 것으로 예상되는 점수를 가정하고 이를 실제 성취와 비교했다고 한다. 예상되는 점수 역시 통계를 바탕으로 추측한 값이기 때문에, 결국 추측에 추측을 더해서 평가한 것이다. 그 때문에 임의적인 결과값이 산출되는 '잡음' 이 발생하는데, 그 점이 문제가 된다. 대규모 집단의 평균 성적과 기껏해야 30명 학생을 가르치는 학급의 성적을 비교하여 같은 결과를 기대하는 것은 무리가 있다. 집단이 작을수록 오차가 크기 때문이다. 만약 한 교사가 1만명 정도를 한꺼번에 가르친다면 정확한 평가가 가능할 지도 모른다. 그러나 30명 학생을 가르친다면, 학급마다 오차가 클 수 있다. 이는 통계학 책들을 보면 앞부분에 나오는 이론이다. 그래프로 그리면 표본이 클수록 중앙이 볼록한 종 모양의 분포도를 보이고, 작을수록 불규칙하고 양 극단에 치우치는 경향이 있다는 것 말이다. 또한 표본이 작을수록 아주 작은 일부의 영향을 크게 받는다. 똑같이 30명의 학생이 있는 두 학급에 25명의 성적이 똑같더라도 남은 5명의 성적에 따라 평균이 크게 차이날 수 있다.
하지만 그런 주장은 반박당할 여지가 있다. 한국의 교사들도 학생들의 성적으로 평가를 받는데, 신입생들의 경우 담임 교사에게 배정하기 전에 미리 배치고사를 치른다. 시험을 쳐서 학생들의 성적에 따라 등수를 매기고 순차적으로 각 학급에 배정하는 것이다. 되도록 학급별로 차이가 나지 않도록 하기 위해서다. 그래야 학생들 성적으로 교사를 평가하는 것이 공평할테니 말이다. 학년이 올라갈 때마다 마찬가지로 성적에 따라 학생들을 각 학급에 골고루 배정한다. 물론, 보통은 1반 담임이 학생주임이고, 전교 1등 학생부터 배정을 받기 때문에 가장 유리하긴 하다. 책에서는 그런 것에 대해 언급이 없었지만 분명 미국도 공평하게 학생들을 배정하려고 했을 것이다. 그렇다면 다른 교사들에 비해서 특정 교사의 학급 성적이 낮다면 그 교사에 문제가 있다고 주장할 수도 있다. 그러나 이런 반박도 또 반박될 수 있다. <벌거벗은 통계학> 에서도 교사 평가에 대한 내용이 나오는데, 저자의 주장과 비슷하게 교사 평가 모형은 태생적인 '잡음' 이 있다고 한다. 단 한 번의 시험으로 평가 결과를 산출하는데, 그 때 특별히 다루기 힘든 학생이나 시험을 방해하는 주변 소음 등 예상치 못한 변수가 발생할 수 있다는 것이다. 연구에 따르면 한 교사의 성과를 평가했을 때 당해 연도와 전 연도 평가의 상관관계는 0.35 정도밖에 되지 않았다고 한다.
내가 생각하기에는, 뭐 딱히 근거가 있다기보다는 그냥 경험상, 학생의 성적은 교사의 능력보다는 가정 환경과 친구의 영향을 더 많이 받는다. 이성 친구를 사귀거나, 짝사랑에 빠지거나, 일진에게 잘못 찍혀서 괴롭힘을 당하거나, 어머니가 병에 걸렸거나, 아버지 사업이 망했거나, 운동이나 게임 혹은 소설 등 다른 흥미 거리에 흠뻑 빠졌거나, 말못할 고민이 있거나, 그 외 등등 성적에 영향을 끼치는 환경은 무수히 많다. 또 반항적인 사춘기 당시 우리들에게는 어른들의 말을 고분고분 따르는 것보다 또래 문화를 형성하는 게 더 중요했다. 공부를 잘하는 것만큼 친구들이랑 공감대를 형성하고 서로 어울리는 것도 엄청 중요했던 것이다. 친구들이랑 어울리지 못하고 외톨이로 지내면 성적이 떨어진다. 꼭 공부 잘하는 학생들과 친해져야만 성적이 올라가는 건 아니다. 자기보다 공부 못하는 친구를 사귀어도, 그 친구가 모르는 걸 가르쳐주고 공부하는 데 도움을 주려고 더 열심히 공부하는 착한 학생들은 성적이 오른다. 가정환경 역시 중요하다. 집안 분위기가 어수선하면 공부에 집중하기 힘들다. 좋은 독서실을 갈 형편이 안되고 오히려 아르바이트를 해서 돈을 벌어야 하는 환경이라면 더 그렇다. 좋은 인간관계와 안정적인 생활 환경은 자존감과 자신감, 행복감을 느끼게 해주고 공부에 더 잘 집중할 수 있게 해준다. 그렇지 않으면 공부에 집중하기 힘들고 좋은 성적을 거두기 힘들다. 교사가 그런 어려움이 있는 학생들을 도와주는 것은 한계가 있다. 교사는 단지 주어진 조건에서 최선을 다 할 뿐이다. 최선을 다 한다고 해서 결과가 좋을 거라 보장할 수 없다. 그러므로 결과가 좋지 않다고 해서 나쁜 교사라고 판단하고 없애려고 하기 보다는 더 좋은 결과를 낼 수 있는 환경을 조성해주는 것이 더 나을 것이다.
교사 평가 모형이 이런 무수한 변수들과 현실을 반영할 수 있을까? 그리고 교사가 정말 실력이 있어서 학생들의 성적을 올릴 수 있다고 해도, 그게 곧바로 시험 결과로 나타나지 않을 수 있다. 배우고 익히는 건 시간이 필요하기 때문이다. 기초가 부족한 학생들의 성적을 향상시키려면 기초부터 다시 가르쳐야 한다. 그런데 어떻게 곧바로 다음 시험 점수가 올라갈 수 있다는 말인가? 입시 위주 주입식 교육 지옥이었던 한국도 한 때 전인교육 바람이 불었던 적이 있다. 아마도 지나치게 성적에만 집착하는 것에 대한 반성이었을 것이다. 혹시 미국은 한국만큼 교육열이 높지 않아서 거꾸로 성적에 집착했던 걸까? 아무리 첨단 기법을 동원하고 온갖 수학 모형을 동원한다고 해도, 학생들의 성적으로 교사를 평가하겠다는 것은 교육에 대한 모욕이 아닐까 싶다. 당장은 성적이 좋지 않더라도, 나중에 그 교사 덕분에 훌륭한 사람이 될 수도 있는 일이다. 성적을 향상시키지 못하더라도 비뚤어질 수 있었던 학생을 올바른 길을 갈 수 있게 인도해줄 수도 있는 일이다. 성적 이외에 보이지 않는 그런 '장기적인 가치' 는 평가할 필요가 없다는 것인가? 이번에도 또 <벌거벗은 통계학> 에서 나오는 얘긴데, 장기간에 걸친 공군사관학교 학생의 성과 연구에서 젊고 의욕있는 젊은 교수와 영감탱이 원로 교수를 비교한 예를 들었다. 젊은 교수한테 배운 학생들이 기초과목 시험에서 더 좋은 점수를 받았다고 한다. 그러나, 그 다음에 배우는 관련 필수 과목은 오히려 영감탱이 원로 교수한테 배운 학생들의 점수가 더 좋았다고 한다. 이에 저자는 경험이 적은 젊은 교수일수록 시험을 위한 강의를 할 가능성이 높은 반면, 경험이 많은 나이든 교수는 시험을 위한 수업 대신 다음에 배울 과목과 졸업 후 인생에 중요한 개념을 더 중요하게 여기고 가르치려 하기 때문이라고 해석했다. 물론 평가는 필요하지만, 신중하지 못한 평가는 안하느니만 못하다. 교사들이 편협한 시각에 치우친 평가 모형 때문에 장기적으로 진정한 교육의 가치를 고민하며 경험을 쌓고 성장하기보다 그저 학생들 시험 점수만 올려주는 기계가 되도록 강요당하고 생존을 위해 학생들의 점수에 연연하며 불안에 떨어야 하는 상황은 교사 뿐만 아니라 학생들에게도 좋지 않다고 생각한다.
저자는 어쩌면 대량살상 수학무기의 가장 두려운 면으로 민주주의를 위협할 가능성을 들었다. 페이스북에서 뉴스피드에 투표 독려 메시지와 함께 투표한 친구들의 인증 사진과 글을 노출시키는 "나는 투표했다" 캠페인을 벌인 후 분석 결과 34만명 정도의 유권자들을 더 투표하게 한 효과가 있었다고 추산했다. 페이스북에서는 뉴스피드를 조작하여 친구들의 투표 인증 사진을 공개하지 않은 집단, 투표 독려 관련된 메시지를 노출하지 않은 집단으로 나누어 각각 60만명 정도 규모의 대조군을 만들어 조사하기도 했는데, 친구들이 투표했다는 메시지를 받은 집단이 2% 정도 "나는 투표했다" 버튼을 더 많이 눌렀다고 한다. 물론, 그들이 실제로도 투표했는지는 알 수 없지만, 2000 년 부시가 플로리다에서 겨우 몇백 표 차이로 대통령에 당선되었으니, 2% 라는 수치는 실제로 후보의 당락을 결정할 수 있을 정도인 것이다. 또한 페이스북은 60여만명 사용자들을 대상으로 뉴스피드의 컨텐츠가 감정에 끼치는 영향을 분석하기 위한 실험을 했다. 언어 처리 소프트웨어를 사용해 긍정적인 것과 부정적인 것으로 분류한 다음, 한 집단의 뉴스피드에는 부정적인 게시물을 절반 이하로 줄이고 다른 집단은 반대로 긍적적인 게시물을 줄였다. 그 결과, 그 게시물에 노출된 사용자들의 게시물을 분석했는데, 부정적인 게시물에 더 많이 노출된 사용자들은 부정적인 게시물을 더 많이 올렸고, 긍정적인 게시물에 더 많이 노출된 사용자들은 긍정적인 게시물을 더 많이 올렸다고 한다. 연구진들은 한 사람의 감정은 다른 사람들에게 전이될 수 있다고 결론내렸다고 한다. 이런 IT 기업들은 마음만 먹으면 사용자들을 조종하는 것도 가능할 지 모른다.
그 외 미국 정치인들의 선거 전략 중 하나인 마이크로 타기팅을 소개했다. 정치가들은 공개적으로 언론을 통해 선거운동을 하기도 하지만, 특정 집단들을 비공개로 방문하거나 모아서 그들이 듣고싶어하는 말을 하며 지지를 호소하기도 한다. 롬니는 금융과 부동산업계 부자들만 참석한 기금 모금 행사에서 그들의 성향에 맞추어 "미국인의 47%가 정부의 관대함에 빌붙어 살아가는 '받는 사람' 인데, 그들은 절대로 나를 지지하지 않을테니 나머지 53% 미국인의 표를 얻는 것이 나에겐 무엇보다 중요하다" 라며 저소득층을 폄하한 것이 몰래카메라에 찍혀 공개되어 세계적인 비판을 받았다. 그 때 그 모습이 들통나지 않았다면 롬니가 성공했을 지도 모를 일이다. 이와 같이 정치가들은 서로 다른 각 집단에 맞춰 얼굴을 바꿔가며 지지를 호소한다. 미국에서는 막대한 유권자 데이터베이스를 구축하고 각각의 가치관과 정보를 고려해 다양한 집단으로 분류한 후, 그에 맞는 차별화된 홍보물을 발송하는 경우도 있다고 한다. 이웃한 두 집이 동일한 후보로부터 각각 다른 내용의 우편물이나 팸플릿을 받을 수 있는 것이다. 한 집은 야생동물 보호를 약속하는 내용을, 그 옆 집은 법과 질서를 강조하는 내용을 보는 식이다. 물론 그 후보가 두 문제 모두 다 모두 관심이 있을 지도 모르지만, 어쩌면 둘 다 관심이 없을 지도 모른다. 저자는 정치가들이 빅데이터와 소비자 마케팅 기술을 결합하여 페이스북 광고 배너나 이메일 등에 적용한 결과 훨씬 더 강력한 마이크로 타기팅 도구를 가지게 되었다고 주장한다. 하지만 인터넷을 이용한 유세는 유권자들 사이에서 공유되기 쉽기 때문에, 정치가들이 더 많은 지지를 얻으려고 지나치게 욕심을 부려 서로 모순되는 내용으로 유권자를 유혹하려다 오히려 화를 자초하게 될 수도 있다. 만약 어떤 정치가가 부자들에게 저소득층을 폄하하며 더 큰 권리와 혜택을 약속하면서, 저소득층 사람들에게 부자들을 비판하며 일자리와 복지와 노동자 권리를 약속한 것이 동시에 유권자들의 게시물로 공개가 된다면 그 정치가는 모순된 모습으로 치명타를 입게 될 것이다. 그러니 정치가들은 그냥 솔직하게 한 쪽 편만 들거나 아니면 환경보호 등 중립적인 가치를 내세우는 게 더 나을 지도 모른다. 한국도 정치가들이 선거철만 되면 평소엔 거들떠 보지도 않던 재래시장이나 고아원이나 노인정을 돌아다니면서 그들이 듣고싶어하는 말만 떠들고 다닌다. 요즘도 카톡 카풀 때문에 택시업계가 파업 등으로 어수선한데, 이 때를 틈타 정부를 비판하고 택시 기사들 편을 들으며 인기를 얻으려는 정치가들이 있다. 그들이 반대로 여당이었어도 똑같이 말했을까 몹시 궁금하다.
이 책을 읽고있으면, 저자가 말하는 대량살상 수학무기가 사실은 그 전부터 있었던 구식 무기가 개량된 것에 불과한 것이라는 것을 알게 된다. 사람들이 서로 평화롭게 어울리며 살다가 갑자기 쨘! 하고 핵미사일이 만들어진 것이 아니란 얘기다. 이미 전부터 서로 치고받고 싸우다가 칼질을 하고 기관총을 갈기고 대포를 쏘고 미사일을 만들고 마침내 핵폭탄을 탑재하게 된 것과 비슷한 것이다. WMD 는 그저 도구일 뿐 그 자체가 문제인 것은 아니다. 그것을 악용하고 오용하는 사람이 문제인 것이다. 저자는 WMD 의 위험한 특성으로 불투명성, 확장성, 피해를 들었다. 채용 지원서 심사, 인적성 검사, 대출 신청 심사, 범죄율 예측, 교사 평가 등 대부분의 알고리즘은 그 자체가 소유권과 저작권을 보호받는 지적 재산이면서 동시에 영업비밀이다. 정확하게 어떤 데이터를 근거로 어떻게 결과를 도출하는지 상세하게 다 알고있는 사람은 극소수거나 아예 없을 수도 있다. 거대한 알고리즘을 한 사람이 모두 다 만들지는 않기 때문이다. 알고리즘은 사람이 만드는 것이므로 잘못된 편견이 심어지거나 오류가 있을 수 있다. 또한 과거의 경향이 미래에도 똑같을 것이라는 가정을 바탕으로 과거의 데이터를 수집해 분석하여 알고리즘을 만드는 것인데, 사회 변화가 클수록 과거의 경향이 미래에도 똑같이 지속될 거라고 보장할 수 없다. 또한 어떤 대상 그 자체나 본질보다는 그 주변의 대리 데이터에 의존하기 때문에 심각하게 왜곡된 결과를 낼 수도 있다. 하지만 이런 잘못된 점들을 밝혀내고 개선할 여지는 적다. 알고리즘이 불투명하게 감추어져 공개되지 않고, 잘 아는 사람도 적도, 효율과 이익에 악영향을 끼치지 않는 오류 따위는 중요하지 않게 여길 것이고, 개선한다고 해도 더 큰 이익을 얻기 위한 방향으로만 나아갈 것이기 때문이다. 하지만 이런 오류로 인해 많은 사람들이 피해를 본다. 또한 그 피해는 또 다른 피해를 낳고, 삶을 파괴할 수도 있다. 예를 들면, 채무불이행 위험이 높다고 평가되면 대출을 거절 당해 집을 구하지 못하게 될 수 있고 일자리를 구하기 힘들어질 수도 있다. 일자리를 구한다 하더라도 좋은 일자리를 구하지 못해 클로프닝 같은 열악한 조건에 놓일 확률이 높다. 생활이 안정되지 못하면 리스크가 크다고 평가받아 보험료도 더 비싸다. 갈수록 피해는 확장되고 생활은 점점 더 어려워진다. WMD 로 혜택을 보는 사람들도 있고, 이를 내세워 유용함을 강조할 수도 있지만, 저자가 소개한 바와 같이 겉으로 잘 드러나보이지는 않지만 고통받는 사람들이 매우 많다. 데이터 처리 기술과 수학 모형을 바탕으로 특정 문제를 해결하기 위해 개발된 알고리즘은 다른 다양한 영역이나 분야에 응용되어 확장될 수 있다. 그렇게 피해는 또 확장된다.
저자는 데이터 처리 과정은 과거를 코드화할 뿐 미래를 창조하지 않는다며, 미래를 창조하려면 도덕적 상상력이 필요하다고 말한다. 그런 능력은 오직 인간만이 가지고 있다. 알고리즘과 기술이 인류에게 가져다주는 혜택에 대한 지나친 희망에서 깨어나 그 한계를 인정해야 한다. 어떤 기술을 개발하기 전에 왜 그런 기술이 필요한지 한 번 더 고민해볼 일이다. 교사 평가 모형처럼 징벌적인 목표보다는, 더 나은 교육 방법과 환경을 찾고 개선하고자 하는 목표를 세우는 것이 더 나을 것이다. 또한 이익만을 따르기 보다는 더 나은 가치와 윤리적 지표를 따르고 공정성을 지키도록 알고리즘과 빅데이터 모형을 만들어야 한다. 저자는 데이터 과학자들과 모형 개발자들도 변화해야 한다며 의사들처럼 히포크라테스 선서 같은 것을 만들고 따르기를 제안한다. 또 WMD 의 오남용과 피해를 막기 위해서, 모형의 성공 여부를 재평가하고 외부인을 통해 알고리즘을 감사하고 공정성을 평가하는 등 알고리즘의 투명성을 확보해야 하며, 그를 위해 적절한 법률 규제가 필요하다고 주장한다. 그렇게 현명하게 관리될 수 있다면 빅데이터 기술은 중요한 통찰을 제공하고 '착한 모형' 으로서 공익에 기여할 수 있을 것이다. 가장 중요한 점은, 수학 모형을 중립적인 불가항력으로 생각하며 멀리 떨어져 있을 것이 아니라, 관심을 갖고 더 많은 질문을 던지며 실제로 어떤 일이 일어나고 있는 지 알아야 한다는 것이다. 어쩌면, 과학자들은 기술을 연구하고 개발하기 전에 도덕, 윤리, 인권, 평등, 자유, 정의 같은 철학적인 주제에 대해 치열하게 고민하고 그 가치를 잊지 않는 것이 더 중요할 지도 모른다. 아니, 과학자들 뿐만 아니라 모든 사람들에게도 마찬가지일 것이다. 고단한 삶에 떠밀려 '생각하는 힘' 은 점점 전문가들의 것으로만 여겨지고 대부분의 사람들은 그 힘을 점점 잃어가고 그저 기계적으로 주어진 삶만 살고있는 것은 아닐까?
● 목차
서론 - 데이터과학자, 퀀트, 그리고 내부고발자
'나쁜' 교사 색출 작전
WMS, 불평등을 프로그램하다
빅데이터의 그림자
1장. 대량살상수학무기의 탄생 : 빅데이터 시대, 알고리즘이 신을 대체하다
모형이란 무엇인가?
과연, 알고리즘은 공정한가?
재범위험성모형과 편견의 덫
대량살상수학무기의 3가지 조건
2장. 셸 쇼크 : 금융과 수학의 결탁이 불러온 파국
어떻게 수학은 금융위기의 공범이 되었나
수학은 미래를 예견하지 못한다
수학 모형의 미몽에서 깨어나다
그러나 변한 것은 없었다
3장. 군비 경쟁 : 데이터의 포로가 된 학교와 학생들
2류 시사 주간지의 대학 줄 세우기
대리 데이터가 현실을 대체하다
텍사스 크리스천 대학교의 명문대 프로젝트
미국 대학 등록금이 비싼 이유
"부정행위를 허용해야 공정하다"
결국, 모두가 피해자
4장. 선동 도구 : 알고리즘은 당신이 한 일을 알고 있다
약자들을 노리는 약탈적 광고
"그들의 아픔을 공략하라"
온라인 광고는 우리를 어떻게 스토킹하는가
탁욕스러운 기업이 빅데이터를 만나면...
5장. 무고한 희생자들 : 가난이 범죄가 되는 미래
귀에 걸면 귀걸이, 코에 걸면 코걸이
불심검문이 오히려 범죄자를 양산한다?
공정성 대 효과성
가난이 범죄가 되는 세상
6장. 디지털 골상학 : 당신은 우리가 원하는 직원이 아닙니다
인적성검사의 비밀
알고리즘은 개성을 싫어한다
세인트 조지 의과대학의 착각
효율성이라는 이름으로 자행되는 차별들
7장. 일정의 노예 : 알고리즘의 노예가 된 노동자들
인간, 진정한 부속품이 되다
사다리 걷어차기
생산성을 점수화하기 위한 시도들
심슨의 역설
우리가 저항해야 하는 이유
8장. 부수적 피해 : 모든 길은 신용점수로 이어진다
당신은 몇 점인가요?
'당신은' 대 '당신과 같은 사람은'
취업도 대출도 사랑도 결정하는 신용평가점수
쓰레기를 넣으면 쓰레기가 나온다
오직 인간만이 공정성을 주입할 수 있다
빅데이터 시대의 아이러니
9장. 안전지대는 없다 : 선의에 감춰진 보험의 민낯
자동차 보험료는 어떻게 결정되는가
더 이상 숨을 곳은 없다
행동적 부족의 탄생
당신의 건강을 관리합니다. 사생활을 침해해서라도...
엉터리 수학의 임금 절도
10장. 표적이 된 시민들 : 민주주의를 위협하는 데이터
세상에서 가장 거대한 실험실
마이크로 타기팅, 유권자 갈라치기
미국 정치권의 빅데이터 활용법
천사도 악마도 될 수 있다.
결론 - 수학 모형의 여행을 마치며
IBM 이 동성애 지지에 나선 이유
도덕적 상상력이 필요하다
알고리즘을 감사하라
착한 모형을 위한 새로운 여행
'읽어본 책' 카테고리의 다른 글
돈으로 살 수 없는 것들 (0) | 2019.01.02 |
---|---|
정의란 무엇인가 (0) | 2018.12.29 |
모두 거짓말을 한다 (0) | 2018.12.09 |
무기화된 거짓말 (0) | 2018.12.05 |
벌거벗은 통계학, 통계의 함정, 괴짜 통계학 (0) | 2018.11.30 |