본문 바로가기
생각

모두 거짓말을 한다

by 오를 2021. 8. 18.
728x90
 

모두 거짓말을 한다

검색 데이터를 이용해 사람들의 숨겨진 진짜 욕망과 생각을 까발린다. 인종주의뿐 아니라 정신질환, 성생활, 아동학대, 낙태, 광고, 종교, 건강 등 다양한 분야에 걸친 충격적인 인간 본성이 거

www.aladin.co.kr

검색 데이터를 이용해 사람들의 숨겨진 진짜 욕망과 생각을 까발리는 책이다. 인종주의뿐 아니라 정신질환, 성생활, 아동학대, 낙태, 광고, 종교, 건강 등 다양한 분야에 걸친 충격적인 인간 본성이 거침없이 담긴 이 책은 우리가 지금까지 알고 있던 인간과 사회에 관한 지식 대부분이 거짓말로 왜곡되어 있다는 것을 알게 한다.


읽기 시작하며 : 빅데이터는 언어다

1. 빅데이터는 어디에서 올까?

"이 새로운 정보 대부분은 구글과 소셜미디어에서 나온다. 일부는 과거에는 캐비넛 서류철에 감춰져 있던 정보가 디지털화된 결과물이다. 일부는 크게 늘어난 시장조사 전문 정보원에게서 나온다."

아날로그 시절에는 "할머니가 곧 빅데이터"였다. 할머니는 다른 누구보다 많은 것을 봐오셨고 사람은 살아온 만큼 데이터(정보, 경험)를 축적하기 때문이다. 하지만 아날로그에서 디지털로 세상이 바뀌면서 데이터는 사람들이 검색 엔진에서 검색하는 내용으로 바뀌었고 사람들 또한 더 이상 할머니와 캐비넛 서류에만 의존하지 않게 됐다.

2. 구글의 등장

1998년에 구글이 등장했다. 구글은 어떻게 다른 검색 엔진들에 비해 크게 성장할 수 있었을까?
그 내용은 알고 보면 아주 흥미롭다.

"다른 검색엔진은 사용자가 검색한 문구가 가장 많이 들어가는 웹사이트를 보여줬다. 빌 클린턴에 관한 정보를 찾으면 인터넷상에서 빌 클린턴을 가장 많이 언급한 웹사이트를 찾는 식이다. 이런 서열 시스템이 불완전한 이유는 여러 가지지만 그중 하나는 시스템을 혼란시키기 쉽다는 데 있다. 이런 시스템에서는 '빌 클린턴 빌 클린턴 빌 클린턴 빌 클린턴 빌 클린턴'이라는 문장이 페이지 어딘가에 숨어 있는 농담 사이트가 백악관 공식 웹사이트보다 높은 점수를 받게 된다.
브린과 페이지는 단순히 단어 수를 세는 것보다 훨씬 더 가치가 큰 새로운 유형의 정보를 기록하는 방법을 찾았다. 웹사이트들은 어떤 주제에 관해 이야기하면서 종종 그 주체를 이해하는 데 도움이 된다고 생각하는 사이트들을 링크해놓는다. 예를 들어 빌 클린턴을 언급한 뉴욕타임스 기사에 백악관 공식 웹사이트 링크를 걸어놓는 식이다. 이렇게 링크된 모든 웹사이트는 빌 클린턴에 관한 훌륭한 정보를 준다. 브린과 페이지는 모든 주제에 관한 이 모든 정보들을 종합할 수 있었다.

대다수의 사람들이 빌 클린턴에 관한 가장 중요한 링크가 그의 공식 웹사이트라고 생각한다면, 대부분의 사람들이 빌 클린턴을 검색하면서 보고자 하는 웹사이트도 아마 그의 공식 웹사이트일 것이다.
이런 종류의 링크는 다른 검색엔진은 고려조차 해보지 않은 데이터였지만 해당 주제에 관한 가장 유용한 정보를 대단히 잘 예측할 수 있게 해줬다.

요점은 구글이 검색 분야에서 지배적인 위치에 오를 수 있었던 이유가 단순히 경쟁자들보다 많은 데이터를 수집했기 때문이 아니라는 점이다. 그들은 더 나은 유형의 데이터를 찾음으로써 검색 분야의 지배자가 됐다. 구글은 링크 분석 덕분에 론칭한 지 2년도 되지 않아 인터넷에서 가장 인기 있는 검색엔진으로 성장했다.
빅데이터 혁명은 점점 더 많은 데이터를 수집하는 것이 아니다. 적절한 데이터를 수집하는 것이다."

그러나 이 빅데이터들이 진실만을 말하고 있을까?

3. 모두 거짓말을 한다

여기서 바로 이 책의 제목인 '모두 거짓말을 한다'가 등장한다. 이 책은 빅데이터를 설명하는 동시에 검색엔진에서 사람들이 검색하는 내용을 살핀다. 그리고 그에 따르면 사람들은 검색할 때 익명으로 그 누구의 눈치도 보지 않고 진실을 말하기 때문에 모두 거짓말을 한다는 것이다.

 

 

"구글 검색을 생각해보자.

사람들을 더 솔직하게 만드는 조건은 무엇인가?

온라인? 그렇다.

혼자? 그렇다."

진실하게 사람들이 검색하는 내용은 이런 것들이다.

아이 낳은 것을 후회해요. 엄마가 나를 때려요. 아빠가 나를 때려요.  추위가 싫어요. 사람들이 짜증 나요. 슬퍼요.

이러한 내용들 외에 인종차별, 성, 정치들에 관한 검색 내용을 보고 있자면 사람은 보기보다 형편없다는 생각이 들기도 한다. 그러나 누군가는 이런 사람의 심리를 이용해 사업을 벌인다.

4. “위대한 사업은 사람들의 비밀을 바탕으로 한다.”

페이스북은 어떻게 생겨났을까?

"저커버그가 하버드대학교에서 공부하는 동안 알게 된 '사람들에 관한 불편한 비밀'이 페이스북의 모든 것을 만들었다고 주장할 수도 있다. 
이 사이트는 '내 외모 괜찮나요? Am I Hot or Not?'이라는 사이트를 모델로 했다. 페이스매시가 하버드 학생 두 명의 사진을 보여주면, 다른 학생들은 둘 중 누가 더 잘생겼는지를 판단한다.
이 사이트는 공분을 샀다. 하지만 하버드대학교 관리자들이 저커버그의 인터넷 접근을 차단하기 전, 즉 사이트가 만들어지고 몇 시간 후 이미 450명이 이 사이트를 봤고 사진에 투표한 횟수는 2만 2000건이었다."

넷플릭스도 빅데이터를 활용했다.

"넷플릭스도 설립 초기에 비슷한 교훈을 얻었다. '사람들이 말하는 것을 믿지 말고 행동하는 것을 믿어라'라는 교훈 말이다. 본래 넷플릭스에는 보고 싶지만 당장은 시간이 없어서 못 보는 영화를 담아두는 칸이 있었다. 넷플릭스는 사용자들에게 여유 시간이 생길 때면 이 영화를 상기시켰다. 그런데 넷플릭스는 데이터에서 이상한 점을 발견했다. 사용자들은 많은 영화를 채워놓지만 며칠 수에 상기시켜도 좀처럼 클릭하지 않았다.
이런 차이에 직면한 넷플릭스는 사람들에게 보고 싶은 영화를 말하라고 하지 않고 비슷한 고객들의 클릭수와 조회수를 기반으로 한 모델을 구축하기 시작했다. 사용자들이 좋아한다고 주장하는 영화가 아닌 데이터가 그들이 즐겨 본다고 말하는 것을 기반으로 영화 목록을 제안한 것이다. 그러자 고객들은 넷플릭스를 더 자주 방문하고 더 많은 영화를 봤다."

이를 더 살펴봐도 실제로 사람들의 심리와 행동은 다르게 나타나는 듯 보인다.


사람들이 말하는 것
친구들을 스토킹하고 싶지 않다.
실제
친구들의 근황을 보고 평가하는 것보다 더 재미있는 일은 이 세상에 많지 않다.
그렇기 때문에
페이스북 창립자 마크 저커버그의 자산 가치는 552억 달러다.

 

사람들이 말하는 것
노동력을 착취하는 공장의 제품은 사고 싶지 않다
실제
근사하면서도 '합리적인 가격'의 제품을 살 것이다.
그렇기 때문에
나이키 공동 창립자 필 나이트의 자산 가치는 254억 달러다.

 

하지만 이것을 비판할 수 있을까?


5. “거대한 음모 따위는 없다. 그저 자본주의가 존재할 뿐.”

일찍부터 사람들의 심리를 이용한 산업은 크게 발전해 왔다. 
코닥의 경우를 보자.
100여 년 동안 사진 속 사람들의 평균적인 얼굴은 무표정했지만 20세기 초반부터 사람들은 사진 속 사람들은 웃기 시작했다. 이는 코닥의 기업, 이윤, 마케팅이 이뤄놓은 결과다.

"20세기 중반, 필름 카메라 회사인 코닥은 사람들이 특별한 때만 사진을 찍는 데 불만을 느끼고 사람들이 더 자주 사진을 찍게 하는 전략을 고안했다. 코닥은 광고에서 사진과 행복을 결부시켰다. 목표는 사람들이 자신이 얼마나 즐거운 시간을 보내고 있는지 남들에게 보여주고자 할 때마다 사진 찍는 습관을 갖게 하는 것이었다. 모두가 미소를 짓은 고등학교 졸업앨범의 사진은 성공적인 광고 캠페인의 결과물이다.  페이스북과 인스타그램에 올라오는 사진들도 마찬가지다."

정치적으로 편향된 보이는 각 신문사의 뉴스도 사실 그들의 견해와 상관이 없다.

"사실, 진보 편향은 신문 독자들의 요구에 맞춘 결과일 뿐이다. 신문 독자층은 평균적으로 약간 좌편향이다 (켄츠코프와 사피로는 이에 대한 데이터를 갖고 있다). 신문이 평균적으로 좌편향인 이유는 그것이 독자들이 원하는 견해이기 때문이다. 거대한 음모 따위는 없다. 그저 자본주의가 존재할 뿐."

그렇다. 자본주의가 있을 뿐이고 자본주의 사회에서 사람들은 살아가며 사람들이 검색하는 빅데이터를 이용해 산업은 빌전하고 있을 뿐이다.

"슈퍼마켓은 사람들이 좋아하는 아이스크림으로 선반을 채우고, 신문은 사람들이 원하는 견해가 무엇인지 파악해서 그것으로 지면을 채운다. 사피로는 내게 이렇게 말했다. '그저 산업일 뿐이죠.' 이것이 뉴스, 분석, 의견 같은 난해한 문제들을 그 구성 요소인 단어로 분해하고 정량화했을 때 우리가 배울 수 있는 사실이다."

6. 다시, 빅데이터

 


"단어가 데이터다. 클릭이 데이터다. 링크가 데이터다. 오타가 데이터다. 꿈속에 나온 바나나가 데이터다. 어조가 데이터다. 쌕쌕거리는 숨소리가 데이터다. 심장박동이 데이터다. 비장의 크기가 데이터다. 검색어는 가장 계시적인 데이터다."

그리고 사람들은 익명으로 검색엔진에서 좀 더 진실하고 자신에게 맞는 단어를 사용해 필요한 검색을 하고 정보를 얻는 듯 보인다

사실 "아이 낳은 것을 후회해요. 엄마가 나를 때려요. 아빠가 나를 때려요. 추위가 싫어요. 사람들이 짜증 나요. 슬퍼요." 실제로 누가 이런 문장식으로 검색을 할까 싶지만 결코 그 검색량은 적지 않다. 그리고 이러한 내용들은 자기고백적인 동시에 세상과 사람이 가진 어두운 구석을 보여준다고 저자는 말한다. 그러나 한편으로 나와 같은 사람이 세상에 또 있다는 사실에 마음이 놓이기도 한다.

 

구글 검색 데이터나 인터넷에 있는 다른 진실의 샘은 이전에는 볼 수 없었던 인간 마음의 가장 어두운 구석을 보여준다.
디지털 자백약은 대체로 세상이 우리 생각보다 좋지 못하다는 것을 보여줄 것이다.


하지만 진실은 유용하다.
남들도 자기 외모에 자신 없어한다는 걸 알면 마음이 놓인다.

세상의 문제에 관한 풍부한 데이터를 수집하는 것은 그것을 고치는 방향으로 내딛는 첫걸음이다.


읽고 나가며 : 진실한 빅데이터는 흥미롭다

끝으로 책에서 재미있었던 사실 한가지를 더 언급하며 '모두 거짓말을 한다'의 책 요약 및 리뷰를 끝마쳐야겠다.

이것이 궁금한 사람은 당신 혼자가 아니다.
연두교서 연설 중에 구글에 가장 많이 올라온 질문


오바마는 몇 살인가?
바이든 옆에 앉은 사람은 누구인가?
베이너는 왜 녹색 넥타이를 맸는가?
베이너의 피부색은 왜 어두운가?

연설 내용이 아니라 넥타이 색깔이나 피부색에 더 관심을 갖는다니. 당시 하원 의장이었던 존 베이너가 누구인지 모르는 것도 정치에 관심이 높지 않았다는 것을 말해준다.

728x90

댓글